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' Plantes tolerantes aux herbicides par contournement de voie metabolique 

La presente invention concerne une nouvelle methode permettant de rendre les 
plantes tolerantes aux herbicides, en particulier aux herbicides inhibiteurs d'HPPD, les 
5 sequences d'acide nucleique codant pour des enzymes susceptibles d'etre employees 
dans cette methode, les cassettes d' expression les contenant et les plantes transgeniques 
comprenant au moins l'une de ces cassettes d' expression. 

Les hydroxy-phenyl pyruvate dioxygenases sont des enzymes qui catalysent la 
reaction de transformation du para-hydroxy-phenyl-pyruvate (HPP) en homogentisate. 

1 0 Cette reaction a lieu en presence de fer (Fe 2+ ) en presence d'oxygene (Crouch N.P. & al., 
Tetrahedron, 53, 20, 6993-7010, 1997). 

On connaft par ailleurs certaines molecules inhibitrices de cette enzyme, qui 
viennent se fixer a l'enzyme pour inhiber la transformation de l'HPP en homogentisate. 
Certaines de ces molecules ont trouve un emploi comme herbicides, dans la mesure ou 

15 rinhibition de la reaction dans les plantes conduit a un blanchiment des feuilles des 
plantes traitees, et a la mort des dites plantes (Pallett K. E. et al. 1997 Pestic. Sci. 50 83- 
84). De tels herbicides ayant pour cible l'HPPD decrits dans l'etat de la technique sont 
notamment les isoxazoles (EP 418 175, EP 470 856, EP 487 352, EP 527 036, EP 560 
482, EP 682 659, US 5 424 276) en particulier 1'isoxaflutole, herbicide selectif du mais, 

20 les dicetonitriles (EP 496 630, EP 496 631), en particulier la 2-cyano-3-cyclopropyl-l- 
(2-SC-2 CH3-4-CF3 phenyl) propane- 1, 3 -dione et la 2-cyano-3-cyclopropyl-l-(2-S02 
CH3-4-2,3 CI2 phenyl) propane- 1, 3-dione, les tricetones (EP 625 505, EP 625 508, US 
5,506,195), en particulier la sulcotrione ou la mesotrione, ou encore les pyrazolinates. 

Des essais pour confirmer que l'HPPD est bien la cible des dicetonitriles (DKN) 

25 et pour mettre en evidence que l'HPPD est, au moins a certaines doses, la cible unique 
des dicetonitriles ont ete effectues en laboratoire en faisant germer des graines 
d'Arabidopsis sur trois types de milieux en conditions steriles in-vitro : 

1 milieu Murashig et Skoog( Murashige, T. and Skoog, F. 1962. A revised medium for a 
rapid growth and bioassays with tobacco tissue culture. Physiol. Plant. 15, 473-479), 

30 experience controle de la germination 

2 milieu MS plus DKN a la dose de lppm 

3 milieu MS plus DKN a la meme dose + Homogentisate a la concentration de 5 mM. 

II est tres net que sur le milieu 1 la germination se fait normalement, chaque 
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plantule developpant deux cotyledons bien verts. Le developpement se fait ensuite 
normalement. Sur le milieu 2, la germination a lieu mais la plantule qui emerge est 
blanche, les deux cotyledons ne presentant aucune pigmentation. Les plantules meurent 
ensuite en quelques jours. Sur le milieu 3, la germination se fait normalement, les 
5 cotyledons sont bien verts. Les plantules se developpent mais tres rapidement, la 
quantite d'homogentisate dans le milieu diminuant, les premiers symptomes de 
blanchiment apparaissent et la croissance des plantes s'arretent, elles finissent par 
mourir comme dans l'essai effectue sur le milieu n°2. 

Ceci permet de confirmer que 1'HPPD est bien la cible des DKN in planta et 

10 qu'elle semble etre la cible unique. Ceci montre aussi que l'homogentisate est transporte 
du milieu de culture jusqu'au site cellulaire ou il est necessaire pour le bon 
fonctionnement de la cellule et la survie de laplante. 

Pour rendre les plantes tolerantes aux herbicides, on dispose actuellement de 
trois strategies, (1) la detoxification de l'herbicide par une enzyme venant transformer 

15 l'herbicide, ou son metabolite actif, en produits de degradation non toxique, comme par 
exemple les enzymes de tolerance au bromoxynil ou au basta (EP 242 236, EP 337 
899) ; (2) la mutation de l'enzyme cible en une enzyme fonctionnelle moins sensible a 
l'herbicide, ou son metabolite actif, comme par exemple les enzymes de tolerance au 
glyphosate (EP 293 356, Padgette S. R. & al., J. Biol. Chem., 266, 33, 1991) ; ou (3) la 

20 surexpression de l'enzyme sensible, de maniere a produire dans la plante des quantites 
suffisantes d' enzyme cible au regard des constantes cinetiques de cette enzyme vis a vis 
de l'herbicide de maniere a avoir suffisamment d'enzyme fonctionnelle, malgre la 
presence de son inhibiteur. 

C'est cette troisieme strategic qui a ete decrite pour obtenir avec succes des 

25 plantes tolerantes aux inhibiteurs d'HPPD (WO 96/38567), etant entendu que pour la 
premiere fois une strategie de simple surexpression de l'enzyme cible sensible (non 
mutee) etait employee avec succes pour conferer aux plantes une tolerance a un niveau 
agronomique a un herbicide. L'identification d'HPPD mutees dans leur partie C- 
terminal presentant une tolerance amelioree aux inhibiteurs d'HPPD a permis d'obtenir 

30 une amelioration de la tolerance des plantes par la mise en ceuvre de la deuxieme 
strategie (WO 99/24585). 

La presente invention consiste en une nouvelle methode permettant de rendre les 
plantes tolerantes a un herbicide qui met en ceuvre une nouvelle ou quatrieme strategie 
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de tolerance herbicide, cette nouvelle strategie comprenant le contournement de la voie 
metabolique inhibee par ledit herbicide. Ce contournement metabolique peut se resumer 
comme suit : 

> soit un herbicide « H » actif en inhibant l'activite d'nne enzyme « E » qui 
5 transforme le substrat « S » en produit « P », ledit produit P et ses metabolites etant 

essentiels a la vie de la plante, 

> le contournement metabolique consiste a exprimer dans la plante au moins une 
nouvelle enzyme « NE » heterologue insensible a « H » permettant la conversion de 
« S » en un produit intermediaire « I », lequel est ensuite transforme en « P » soit 

10 pas les voies de biosynthese naturelles de la plante soit par l'expression d'au moins 
une autre enzyme heterologue « AE » egalement insensible a « H », 

> le contournement metabolique consistant egalement a exprimer au moins une autre 
enzyme heterologue « AE » insensible a « H » permettant la conversion de « I » en 
« P », « I » etant soit un intermediaire naturellement produit par la plante soit 

15 obtenu par l'expression d'au moins une nouvelle enzyme heterologue «NE» 
insensible a « H » permettant la conversion de « S » en « I ». 
La presente invention concerne plus particulierement une nouvelle methode 
permettant de rendre les plantes tolerantes aux inhibiteurs d'HPPD, ladite methode 
comprenant le contournement metabolique de l'HPPD. 
20 Aucune voie de contournement metabolique n'a ete decrite a ce jour dans les 
plantes. 

On connait de la litterature que la conversion de l'HPP en homogentisate peut etre 
obtenue en effectuant d'abord une conversion de l'HPP en acide 4- 
hydroxyphenylacetique (4-HPA) par un extrait enzymatique presentant une activite 

25 HPP oxydase suivie de la conversion du 4-HPA en homogentisate par un extrait 
enzymatique presentant une activite 4-HPA 1 -hydrolase (WO 99/34008). Cette voie de 
contournement est representee par la Figure 1 . 

Une etude bibliographique revele que les activites enzymatiques necessaires pour la 
construction de la voie de contournement de l'HPPD ont ete caracterisees sur des 

30 extraits bruts bacteriens dans les annees 1970. Ainsi, les activites HPP oxydase (HPPO, 
E.G. 1.2.3.-) et 4-HPA 1-hydroxylase (HP AH, E.G. 1.14.13.18.) ont ete identifiees 
respectivement chez Arthrobacter globiformis (Blakley, 1977) et chez Pseudomonas 
acidovorans (Hareland et at, 1975). Depuis lors, seule la HP AH a ete purifiee par 
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Suemori et al. (1996), cependant, ni la sequence proteique ni la sequence nucleique ne 
sont publiees. II faut done identifies les genes codant ces activites enzymatiques. 

Dans la voie de contournement, la conversion de l'HPP en HGA se fait via le 4- 
HPA. Or, le 4-HPA est un compose rarement identifie chez les plantes. II est present 
5 chez YAstilbe chinensis (Kindl, 1969), dans les Plantago sp. (Swiatek, 1977), dans le 
pissenlit (Taraxacum officinale ; Dey & Harborne, 1997), chez les Artemisia (Swiatek et 
al, 1998), dans le fruit du Forsythia suspensa (Liu et al, 1998) et enfm chez l'algue 
marine Ulva lactuca (Flodin et al, 1999). II y a peu de donnees sur son origine. II 
semble pouvoir provenir de la tyrosine, du shikimate, de la tyramine. II n'y a pas 

10 davantage d' information sur son devenir et son r61e dans la plante. Kindl (1969) a 
montre sa degradation via l'acide 3,4-dihydroxyphenylacetique tandis que Flodin et al. 
(1999) ont demontre sa conversion via l'acide 4-hydroxymandelique en 2,4,6- 
tribromophenol qui s'accumule dans l'algue verte Ulva lactuca. Gross (1975) suggere 
que le 4-HPA pourrait etre un regulateur de croissance chez certaines plantes 

15 superieures et Abe et al. (1974) le considerent comme un analogue d'auxine chez les 
algues. 

Pour mettre en oeuvre la voie de contournement metabolique de l'HPPD il aura fallu 
au prealable identifier et isoler les genes et les sequences d'acide nucleique codant pour 
la ou les enzymes responsables des deux activites ci-dessus. 

20 Definitions selon Pinvention 

« Sequence d'acide nucleique » : une sequence nucleotidique ou polynucleotide, 
pouvant etre de type ADN ou ARN, de preference de type ADN, notamment double 
brin. La sequence d'acide nucleique peut etre d'origine naturelle, en particulier ADN 
genomique ou ADNc, ou encore une sequence synthetique ou semi-synthetique, les 

25 acides nucleiques la comprenant ayant ete choisis soit pour optimiser les codons d'une 
sequence codante en fonction de l'organisme hote dans lequel elle sera exprimee, soit 
pour introduire ou eliminer un ou plusieurs sites de restriction. Les methodes de 
preparation des sequences d'acide nucleique synthetiques ou semi-synthetiques sont 
bien connues de l'homme du metier. 

30 « Sequence capable de s'hybridiser de maniere selective » : les sequences d'acide 
nucleique qui s'hybrident avec une sequence d'acide nucleique de reference a un niveau 
supperieur au bruit de fond de maniere significative. Le bruit de fond peut etre lie a 
l'hybridisation d'autres sequences d'ADN presentes, notamment d'autres ADNc 
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presentes dans vine banque d'ADNc. Le niveau du signal genere par l'interaction entre la 
sequence capable de s'hybridiser de maniere selective et les sequences definies par les 
sequence ID ci-dessus selon l'invention est generalement 10 fois, de preference 100 fois 
plus intense que celui de l'interaction des autres sequences d'ADN generant le bruit de 
5 fond. Le niveau d'interaction peut etre mesure par exemple , par marquage de la sonde 
avec des elements radioactifs, comme le 32P. L'hybridation selective est generalement 
obtenue en employant des conditions de milieu ires severes (par exemple NaCl 0,03 M 
et citrate de sodium 0,03 M a environ 50°C-60°C). L'hybridation peut bien entendu etre 
effectuee selon les methodes usuelles de 1'etat de la technique (notamment Sambrook & 

10 al., 1989, Molecular Cloning : A Labratory Manual). 

« Homologue d'une sequence d'acide nucleique » : sequence d'acide nucleique 
presentant une ou plusieurs modifications de sequence par rapport a une sequence 
d'acide nucleique de reference. Ces modifications peuvent etre obtenues selon les 
techniques usuelles de mutation, ou encore en choisissant les oligonucleotides 

1 5 synthetiques employes dans la preparation de ladite sequence par hybridation. Au regard 
des multiples combinaisons d'acides nucleiques pouvant conduire a l'expression d'un 
mSme acide amine, les differences entre la sequence de reference selon l'invention et 
l'homologue correspondant peuvent etre importantes. De maniere avantageuse, le degre 
d'homologie sera d'au moins 60 % par rapport a la sequence de reference, de preference 

20 d'au moins 70 %, plus preferentiellement d'au moins 80%, encore plus 
preferentiellement d'au moins 90 %. Ces modifications sont generalement et de 
preference neutres, c'est a dire que pour une sequence codante elles n'affectent pas la 
sequence primaire de la proteine ou du peptide code. Elles peuvent toutefois introduire 
des modifications non silencieuses, ou mutations, qui n'affectent pas la fonction de la 

25 sequence d'acide nucleique par rapport a la sequence de reference. Les methodes de 
mesure et d'identification des homologies entre les sequences d'acides nucleiques sont 
bien connues de 1'homme du metier. On peut employer par exemple les programmes 
PILEUP ou BLAST (notamment Altschul & al., 1993, J. Mol. Evol. 36 :290-300 ; 
Altschul & al., 1990, J. Mol. Biol. 215 :403-10). 

30 « Fragments » : fragment d'une sequence d'acide nucleique ou polypeptidique de 
reference pour laquelle des parties ont ete deletees mais qui conservent la fonction de 
ladite sequence de reference. 

« Heterologue » : sequence d'acide nucleique differente de la sequence d'acide 
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nucleique ayant la meme fonction dans un organisme naturel.Une sequence heterologue 
peut consister en line sequence d'acide nucleique modifiee in situ dans son 
environement naturel. II peut egalement s'agir d'une sequence d'acide nucleique isolee 
de son organisme naturel puis reintroduite dans ce meme organisme. II peut egalement 
5 s'agit d'une sequence d'acide nucleique heterologue par rapport a une autre sequence 
d'acide nucleique, c'est a dire une sequence associee a une autre sequence, cette 
association ne se trouvant pas dans la nature. C'est le cas notamment des cassettes 
d'expression constituees de differentes sequences d'acide nucleique ne se trouvant pas 
generalement associees dans la nature. 

10 « Homologue d'une sequence proteique » : sequences proteiques dont la sequence 
primaire est differente de la sequence primaire de la proteine de reference, mais qui 
remplit la meme fonction que cette sequence de reference. Les methodes de mesure et 
d'identification des homologies entre polypeptides ou proteines sont egalement connues 
de l'homme du metier. On peut employer par exemple le « package » UWGCG et le 

15 programme BESTFITT pour calculer les homologies (Deverexu & al., 1984, Nucleic 
Acid Res. 12,387-395). 

« Cassette d'expression » : sequence d'acide nucleique comprenant differents 
elements fonctionnels necessaires a l'expression d'une sequence codante dans un 
organisme hote. Ces elements fonctionnels comprennent dans le sens de la transcription 

20 une sequence de regulation promotrice, egalement appelee promoteur, liee de maniere 
fonctionnelle a une sequence codante et une sequence de regulation terminatrice, 
egalement appelee terminateur ou stop. La cassette d'expression peut egalement 
comprendre entre la sequence de regulation promotrice et la sequence codante des 
elements de regulations tels que des activateurs de transcription ou « enhancers » et/ou 

25 des introns. 

« Organisme hote » : on entend essentiellement selon 1' invention les cellules 
vegetales ou les plantes. Pour les vecteurs de clonages, les organismes hotes peuvent 
egalement etre des bacteries, des champignons ou des levures. 

« Cellule vegetale » : cellule issue d'une plante et pouvant constituer des tissus 
30 indifferencies tels que des cals, des tissus differencies tels que des embryons, des parties 
de plantes, des plantes ou des semences. 

« Plante » : organisme multicellulaire differencie capable de photosynthese, en 
particulier monocotyledone ou dicotyledone, plus particulierement des plantes de 
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culture destinees ou non a 1' alimentation animale ou humaine, comme le riz, le mai's, le 
ble, 1'orge, la canne a sucre, le colza, le soja, la betterave, la pomme de terre, le tabac, le 
coton, le trefle, le gazon, ou les plantes ornementales comme les petunias, ou encore les 
bananiers, la vigne, les framboises, les fraises, les tomates, les salades, etc. 
5 « Sequence de regulation promotrice » : Comme sequence de regulation promotrice 
dans les plantes, on peut utiliser toute sequence de regulation promotrice d'un gene 
s'exprimant naturellement dans les plantes en particulier un promoteur s'exprimant 
notamment dans les feuilles des plantes, comme par exemple des promoteurs dits 
constitutifs d'origine bacterienne, virale ou vegetale ou encore des promoteurs dits 

10 lumiere dependants comme celui d'un gene de la petite sous-unite de ribulose- 
biscarboxylase/oxygenase (RuBisCO) de plante ou tout promoteur convenable connu 
pouvant etre utilise. Parmi les promoteurs d'origine vegetale on citera les promoteurs 
d'histone tels que decrits dans la demande EP 0 507 698, ou le promoteur d'actine de riz 
(US 5,641,876). Parmi les promoteurs d'un gene de virus de plante, on citera celui de la 

1 5 mosaique du choux fleur (CAMV 1 9S ou 35S), du CsVMV (US . . .) ou le promoteur du 
circovirus (AU 689 311). On peut encore utiliser une sequence de regulation promotrice 
specifique de regions ou de tissus particuliers des plantes, et plus particulierement des 
promoteurs specifiques des graines ([22] Datla, R.& al., Biotechnology Ann. Rev. 
(1997) 3, 269-296), notamment les promoteurs de la napine (EP 255 378), de la 

20 phaseoline, de la glutenine, de l'heliantinine (WO 92/17580), de l'albumine (WO 
98/45460), de l'oelosine (WO 98/45461), de l'ATSl ou de l'ATS3 (PCT/US98/06978, 
deposee le 20 octobre 1998, incorporee ici par reference). On peut egalement employer 
un promoteur inductible avantageusement choisi parmi les promoteurs de phenylalanine 
ammoniac lyase (PAL), d'HMG-CoA reductase (HMG), de chitinases, de glucanases, 

25 d'inhibiteurs de proteinase (PI), de genes de la famille PR1, de la nopaline synthase 
(nos) ou du gene vspB (US 5 670 349, Tableau 3), le promoteur HMG2 (US 5 670 349), 
le promoteur de la beta-galactosidase (ABG1) de pomme ou le promoteur de 1' amino 
cyclopropane carboxylate syntase (ACC synthase) de pomme (WO 98/45445). 

« Activateurs de transcription ("enhancer") » : on citera par exemple l'activateur de 

30 transcription du virus de la mosaique du tabac (VMT) decrit dans la demande WO 
87/07644, ou du virus etch du tabac (VET) decrit par Carrington & Freed. 

« Introns » : sequences d'acide nucleique non traduites. On citera par exemple 
l'intron 1 du gene d'histone d'Arabidopsis tel que decrit dans la demande de brevet 
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WO 97/04114 pour une expression dans les plantes dicotyledones, le premier intron de 
l'actine de riz decrit dans la demande de brevet WO 99/34005, ou l'intron adhl de mais 
pour une expression dans les plantes monocotyledones. 

« Sequence codante » : sequence d'acide nucleique traduite. Elle comprend une 
5 sequence codant pour une proteine ou un peptide d'interet, eventuellement fusionnee en 
5' ou en 3' avec une sequence codant pour un peptide signal ou d'adressage vers un 
compartiment cellulaire particulier. 

« Peptide signal ou d'adressage » : peptides fusionnes a une proteine ou a un 
peptide d'interet dans leur partie N- ou C-terminale, reconnus par la machinerie 

10 cellulaire permettant l'adressage de la proteine ou du peptide d'inter§t vers un 
compartiment cellulaire particulier. II s'agit en particulier de peptides de transit 
chloroplastiques permettant l'adressage de la proteine ou du peptide d'interet dans les 
chloroplastes, ou de peptides signaux vers divers compartiments cellulaires, par 
exemple la vacuole, les mitochondries, le reticulum endoplastique, l'appareil de golgi, 

15 etc. Le role de telles sequences proteiques sont notamment decrites dans le numero 38 
de le revue Plant molecular Biology (1998) consacre en grande partie aux transports des 
proteines dans les differents compartiments de la cellule vegetale (Sorting of proteins to 
vacuoles in plant cells pp 127-144 ; the nuclear pore complex pp 145- 162 ; protein 
translocation into and across the chloroplastic enveloppe membranes pp 91-207 ; 

20 multiple pathways for the targeting of thylakoid proteins in chloroplasts pp 209-221 ; 
mitochondrial protein import in plants pp 3 1 1-338). 

« Peptide de transit chloroplastique » : le peptide de transit chloroplastique est code 
par une sequence d'acide nucleique en 5' de la sequence d'acide nucleique codant pour 
une proteine ou un peptide d'interet, de maniere a permettre l'expression d'une proteine 

25 de fusion peptide de transit/proteine (peptide) d'interet. Le peptide de transit permet 
d'adresser la proteine ou le peptide d'interet dans les plastes, plus particulierement les 
chloroplastes, la proteine de fusion etant clivee entre le peptide de transit et la proteine 
ou le peptide d'interet au passage de la membrane des plastes. Le peptide de transit peut 
etre simple, comme un peptide de transit d'EPSPS (US 5,188,642) ou un peptide de 

30 transit de la petite sous-unite de ribulose-biscarboxylase/oxygenase ( ssu RuBisCO) 
d'une plante, eventuellement comprenant quelques acides amines de la partie N- 
terminale de la ssu RuBisCO mature (EP 189 707) ou encore un peptide de transit 
multiple comprenant un premier peptide de transit de plante fusionne a une partie de la 
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sequence N-terminale d'une proteine mature a localisation plastidiale, fusionnee a un 
deuxieme peptide de transit de plante tel que decrit dans le brevet EP 508 909, et plus 
particulierement le peptide de transit optimise comprenant un peptide de transit de la ssu 
RuBisCO de tournesol fusionne a 22 acides amines de l'extremite N-terminale de la ssu 
5 RuBisCO de mai's fusionnee au peptide de transit de la ssu RuBisCO de mais tel que 
decrit avec sa sequence codante dans le brevet EP 508 909. 

« Peptide signal » : ces sequences peptidiques sont notamment decrites dans le 
numero 38 de le revue Plant molecular Biology (1998) consacre en grande partie aux 
transports des proteines dans les differents compartiments de la cellule vegetale (Sorting 

10 of proteins to vacuoles in plant cells pp 127-144 ; the nuclear pore complex ppl45-162 ; 
protein translocation into and across the chloroplastic enveloppe membranes pp 91-207 ; 
multiple pathways for the targeting of thylakoid proteins in chloroplasts pp 209-221 ; 
mitochondrial protein import in plants pp 311-338). Des peptides d'adressage vers la 
vacuole sont largements decrits dans la litterature (Neuhaus J.M. and Rogers J.C Sorting 

15 of proteins to vacuoles in plant cellsPlant molecular Biology 38 : 127-144, 1998). De 
preference, le peptide vacuolaire est le peptide vacuolaire de la proteine decrite dans 
J.M. Ferullo et al (Plant Molecular Biology 33 : 625-633, 1997), fusionne" a la partie C- 
terminale de la proteine ou du peptide d'interSt. 

« Sequence de regulation terminatrice » : comprenant egalement les sequences de 

20 polyadenylation, on entend toute sequence fonctionnelle dans les cellules vegetales ou 
les plantes qu'elles soient d'origine bacterienne, comme par exemple le terminateur nos 
d'Agrobacterium tumefaciens, d'origine virale, comme par exemple le terminateur du 
CaMV 35S, ou encore d'origine vegetale, comme par exemple un terminateur d'histone 
tel que decrit dans la demande EP 0 633 317. 

25 « Vecteur » : vecteur de clonage et/ou d' expression pour la transformation d'un 
organisme hote contenant au moins une cassette d' expression. Le vecteur comprend 
outre la cassette d' expression, au moins une origine de replication. Le vecteur peut etre 
constirue par un plasmide, un cosmide, un bacteriophage ou un virus, transform.es par 
1'introduction de la cassette d'expression. De tels vecteurs de transformation en fonction 

30 de 1' organisme hote a transformer sont bien connus de l'homme du metier et largement 
decrits dans la litterature. Pour la transformation des cellules vegetales ou des plantes, il 
s'agira notamment d'un virus qui peut etre employe pour la transformation des plantes 
developpees et contenant en outre ses propres elements de replication et d'expression. 
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De maniere preferentielle, le vecteur de transformation des cellules vegetales ou des 
plantes est un plasmide. 
HPP Oxydase 

Un premier objet de 1' invention concerne une sequence d'acide nucleique codant 
5 pour une HPP Oxydase, et le polypeptide correspondant. De maniere preferentielle, 
l'HPP oxydase est insensible aux inhibiteurs d'HPPD, en particulier aux isoxazoles 
comme l'isoxaflutole et leurs diketorritriles, notamment ceux definis precedemment. 
L'HPP oxydase est notamment une HPP oxydase d'origine bacterienne, par exemple 
d'Arthrobacter, en particulier d'Arthrobacter globiformis. L'HPP oxydase est 
1 0 avantageusement une proteine dont la sequence primaire d'acides amines est representee 
par l'identificateur de sequence n°2 (SEQ ID NO 2) ses sequences homologues et ses 
fragments. 

Des sequences proteiques d'HPP oxydases homologues de la SEQ ID NO 2 sont 
notamment representees par les SEQ ID NO 4 et 6, ses sequences homologues et ses 
15 fragments. 

L'HPP oxydase representee par la SEQ ID NO 4 correspond a l'HPP oxydase de la 
SEQ ID NO 2 pour laquelle une Glycine est remplacee par une Alanine. 

La presente invention concerne egalement une sequence d'acide nucleique codant 
pour une HPP oxydase telle que defmie ci-dessus. 
20 De maniere preferentielle, la sequence codant pour l'HPP oxydase est une sequence 
d'ADN, notamment ADN genomique ou ADN-c, en particulier une sequence 
heterologue ou isolee. 

La sequence codant pour une HPP oxydase selon 1' invention est notamment choisie 
parmi les sequences codantes des sequences d'ADN representees par les SEQ ID NO 1, 
25 3, 5 ou 15, leurs sequences homologues, leurs fragments et les sequences capable de 
s'hybrider de maniere selective aux SEQ ID 1, 3, 5 ou 15. 

La sequence codante de la SEQ ID NO 5 compre nd trois mutations en positions 
463, 602 et 1511 par rapport a la SEQ ID NO 1 qui sont silencieuses, c'est a dire 
n'introduisant aucune modification du polypeptide correspondant. 
30 4-HPA l-hvdroxvlase 

Un deuxieme objet de l'invention concerne les moyens necessaires a l'expression de 
la 4-HPA 1 -hydroxylase. Contrairement a ce qui etait attendu de la litterature sur 
l'activite de certains extraits proteiques, il a ete constate que l'activite 4-HPA 1- 
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hydroxylase dans les bacteries, en particulier Pseudomonas, resultait de la somme de 
l'activite de deux enzymes denommees ci-apres HP AH et HP AC. 
HP AH 

L'HPAH permet la conversion de l'HPA en metabolite intermediate denomme ci- 
5 apres metabolite Z dont la structure reste indeterminee. II peut etre envisage 
serieusement que l'HPAH permet rhydroxylation du noyau aromatique de l'HPA, le 
metabolite Z se stabilisant sous forme d'une cetone. Cette hypothese d'activite 
enzymatique est representee sur la figure 2. 

Un deuxieme objet de 1' invention concerne done une sequence d'acide nucleique 
10 codant pour une HP AH, et le polypeptide correspondant. De maniere preferentielle, 
l'HPAH est insensible aux inhibiteurs d'HPPD, en particulier aux isoxazoles comme 
risoxaflutole et leurs diketonitriles, notamment ceux definis precedemment. L'HPAH 
est notamment une HPAH d'origine bacterienne, par exemple de Pseudomonas, en 
particulier de Pseudomonas acidovorans. L'HPAH est avantageusement une proteine 
15 dont la sequence primaire d'acides amines est representee par les identificateurs de 
sequence n°8 et 18 (SEQ ID NO 8 et SEQ ID NO 18) leurs sequences homologues et 
leurs fragments. 

La presente invention concerne egalement une sequence d'acide nucleique codant 
pour une HPAH telle que definie ci-dessus. 
20 De maniere preferentielle, la sequence codant pour l'HPAH est une sequence 
d'ADN, notamment ADN genomique ou ADN-c, en particulier une sequence 
heterologue ou isolee. 

La sequence codant pour une HPAH selon 1' invention est notamment choisie parmi 
les parties codantes des sequences representees par les SEQ ID NO 7 ou 17, leurs 
25 sequences homologues, leurs fragments et les sequences capable de s'hybrider de 
maniere selective aux SEQ ID NO 7 ou 17. 
HPAC 

L'HPAC est la deuxieme enzyme permetant la conversion du metabolite Z en en 
homogentisate. 

30 Un troisieme objet de 1' invention concerne done une sequence d'acide nucleique 
codant pour une HPAC, et le polypeptide correspondant. De maniere preferentielle, 
l'HPAC est insensible aux inhibiteurs d'HPPD, en particulier aux isoxazoles comme 
risoxaflutole et leurs diketonitriles, notamment ceux definis precedemment. L'HPAH 
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est notamment une HP AC d'origine bacterienne, par exemple de Pseudomonas, en 
particulier de Pseudomonas acidovorans. L'HPAH est avantageusement une proteine 
dont la sequence primaire d'acides amines est representee par ridentificateur de 
sequence n°10 (SEQ ID NO 10) ses sequences homologues et ses fragments. 
5 Des sequences proteiques d'HPAC homologues de la SEQ ID NO 10 sont 
notamment representees par les SEQ ID NO 12, 14 et 20, leurs sequences homologues 
et leurs fragments. 

La presente invention concerne egalement une sequence d'acide nucleique codant 
pour une HP AC telle que defmie ci-dessus. 
10 De maniere preferentielle, la sequence codant pour l'HPAC est une sequence 
d'ADN, notamment ADN genomique ou ADN-c, en particulier une sequence 
heterologue ou isolee. 

La sequence codant pour une HP AC selon 1'invention est notamment choisie parmi 
les parties codantes des sequences representees par les SEQ ID NO 9, 11, 13 ou 19, 
15 leurs sequences homologues, leurs fragments et les sequences capables de s'hybrider de 
maniere selective aux SEQ ID NO 9, 11, 13 ou 19. 

Cassettes d'expression 

La presente invention concerne egalement une cassette d'expression dont la 
sequence codante comprend une sequence d'acide nucleique selectionnee parmi les 

20 sequences d'acide nucleique codant pour une HGA oxydase, une HGAH ou HGAC 
telles que definies ci-dessus. 

La sequence codante peut egalement comprendre en 5' ou en 3' une sequence codant 
pour un peptide signal ou un peptide de transit. De maniere avantageuse, la sequence 
codante comprend en 5' de la sequence codant pour HGA oxydase, une HGAH ou une 

25 HGAC, une sequence codant pour un peptide de transit d'adressage chloroplastique, en 
particulier un peptide de transit multiple, plus particulierement le peptide de transit 
optimise. 

La presente invention concerne done egalement une proteine de fusion peptide de 
transit/HGA oxydase, peptide de transit/HGAH ou peptide de trasit/HGAC, la sequence 
30 du peptide de transit etant deflnie precedemment, en particulier la sequence du peptide 
de transit optimise tel que decrit dans la demande de brevet EP 508 909. 

De maniere preferentielle, la sequence de regulation promotrice est choisie parmi les 
sequence de regulation promotrice permettant une expression constitutive de la 
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sequence codante. II s'agira en particulier des sequences des promoteurs du CaMV 35S, 

du CsVMV, de l'actine de riz ou d'histone. 

On peut egalement choisir d'exprhner les sequences codantes selon 1'invention a un 

niveau d'expression voisin du niveau d'expression du gene que Ton cherche a 
5 contourner. On pourra employer dans la cassette d'expression selon 1'invention une 

sequence de regulation promotrice choisie parmi les sequences de regulation 

promotrices d'HPPD de plantes. 

Pour 1' expression des trois enzymes HPP oxydase, HGAH et HGAC dans une m&ne 

plante, on pourra choisir les cassettes d'expression des sequences codantes 
10 correspondantes, des sequences de regulation promotrices differentes presentant des 

profils d'expression differents, par lew force et/ou leur localisation dans les differents 

organes fonctionnels de la plante. 

On pourra choisir des sequences de regulation promotrice permettant un gradient 

d'expression HGAC>HGAH>HPP oxydase ou inversement. 
15 Pour l'expression de l'HPP oxydase, de l'HGAH et de l'HGAC, la sequence de 

regulation promotrice est avantageusement choisie parmi le groupe comprenant les 

promoteurs d'HPPD de plante, d'histone H3 ou H4, notamment d'Arabidopsis ou de 

mais, en particulier ceux decrits dans la demande de brevet EP 507 698, de SSU de 

RuBisCO de plante, en particulier de tournesol ou de mai's comme decrit dans la 
20 demande de brevet WO 99/25842, du CaMV 35S ou du CsVMV, et leurs combinaisons, 

en particulier les promoteurs hybrides histone/35S tels que decrits dans les exemples de 

la demande de brevet EP 507 698. Pour une expression dans les plantes 

monocotyledones, ces sequences de regulation promotrices seront avantageusement 

associees avec le premier intron de Tacrine de riz. 
25 Selon un mode de realisation de 1'invention, la cassette d'expression codant pour 

une HPP oxydase comprend un promoteur d'histone, une sequence codant pour une 

HPP oxydase et un terminateur d'histone (Figure 12 ; SEQ ID NO 15). 

Selon un autre mode de realisation de 1'invention, la cassette d'expression codant 

pour une HP AH comprend un promoteur CaMV 35S, une sequence codant pour une 
30 HPAHet un terminateur NOS (Figure 1 1 ; SEQ ID NO 17). 

Selon un autre mode de realisation de rinvention, la cassette d'expression codant 

pour une HP AC comprend un promoteur CsVMV, une sequence codant pour une HP AC 

et un terminateur NOS (Figure 10 ; SEQ ID NO 19). 
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Vecteurs : 

La presente invention concerne egalement un vecteur de clonage et/ou d' expression 
comprenant au moins une cassette d'expression selon l'invention. 

Selon un premier mode de realisation de l'invention, le vecteur comprend une seule 
5 des cassettes d'expression selon l'invention choisie parmi les cassettes comprenant une 
sequence codante pour une HPP oxydase, une HGAH ou HGAC telles que definies 
precedemment. 

Selon un deuxieme mode de realisation de l'invention, le vecteur comprend deux 
cassettes d'expression selon l'invention choisies parmi les cassettes comprenant une 
10 sequence codante pour une HPP oxydase, une HGAH ou HGAC telles que definies 
precedemment associees deux a deux dans un meme vecteur : HPP oxydase et HGAH, 
HPP oxydase et HGAC, HGAH et HGAC. 

Un vecteur comprenant une cassette d'expression codant pour l'HPAH etune autre 
codant pour l'HPAC peut comprendre la combinaison des deux cassettes d'expression 
15 definies precedemment (SEQ ID NO 17 et 19). Une telle cassette d'expression est 
representee par la Figure 13 et la SEQ ID NO 21. 

Selon un troisieme mode de realisation de l'invention, le vecteur comprend trois 
cassettes d'expression selon l'invention, une premiere cassette d'expression de l'HPP 
oxydase, une deuxieme cassette d'expression de l'HGAH et une troisieme cassette 
20 d'expression de l'HGAC. Une telle cassette d'expression peut comprendre la 
combinaison des trois cassettes definies precedement (SEQ ID NO 15, 17 et 19). Un tel 
vecteur est representee sur la figure 14 et la SEQ ID NO 22. 

Les vecteurs selon l'invention tels que definis ci-dessus peuvent egalement 
comprendre des cassettes d'expression d'autres proteines ou peptides d'interet. 
25 Lorsque le vecteur comprend plusieurs cassettes d'expression, ces dernieres peuvent 
prendre differentes orientations deux a deux l'une par rapport a l'autre, colineaires, 
divergentes ou convergentes. 

Les cassettes d'expression d'autres proteines ou peptides d'interet comprennent une 
sequence d'acide nucleique codant pour des proteines ou peptides d'interet differents de 
30 l'HPP oxydase, de l'HGAH et de l'HGAC definis ci-dessus. 

II peut s'agir de sequences d'un gene codant pour un marqueur de selection comme 
d'un gene conferant a la plante transformee de nouvelles proprietes agronomiques, ou 
d'un gene d' amelioration de la qualite agronomique de la plante transformee. 
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Marqueurs de Selection 
Parmi les genes codant pour des marqueurs de selection, on peut citer les genes de 
resistance aux antibiotiques, les genes de tolerance aux herbicides (bialaphos, 
glyphosate ou isoxazoles), des genes codant pour des enzymes rapporteurs facilement 
5 identifiables comme l'enzyme GUS, des genes codant pour des pigments ou des 
enzymes regulant la production de pigments dans les cellules transformees. De tels 
genes marqueurs de selection sont notamment decrits dans les demandes de brevet EP 
242 236, EP 242 246, GB 2 197 653, WO 91/02071, WO 95/06128, WO 96/38567 ou 
WO 97/04103. 
10 Genes d'interet 

Parmi les genes conferant de nouvelles proprietes agronomiques aux plantes 
transformees, on peut citer les genes conferant une tolerance a certains herbicides, ceux 
conferant une resistance a certains insectes, ceux conferant une tolerance a certaines 
maladies, etc. De tels genes sont notamment decrits dans les demandes de brevet WO 
15 91/02071 et WO 95/06128. 

Tolerance herbicide 

La presente invention est particulierement appropriee pour 1' expression de genes 
conferant une tolerance a certains herbicides aux cellules vegetales et aux plantes 
monocotyledones transformees. Parmi les genes conferant une tolerance a certains 

20 herbicides, on peut citer le gene Bar conferant une tolerance au bialaphos, le gene 
codant pour une EPSPS appropriee conferant une resistance aux herbicides ayant 
l'EPSPS comme cible comme le glyphosate et ses sels (US 4,535,060, US 4,769,061, 
US 5,094,945, US 4,940,835, US 5,188,642, US 4,971,908, US 5,145,783, US 
5,310,667, US 5,312,910, US 5,627,061, US 5,633,435, FR 2 736 926), le gene codant 

25 pour la glyphosate oxydoreductase (US 5,463,175), ou encore un gene codant pour une 
HPPD conferant une tolerance aux herbicides ayant pour cible l'HPPD comme les 
isoxazoles, notamment l'isoxafutole (FR 95 06800, FR 95 13570), les dicetonitriles (EP 
496 630, EP 496 631) ou les tricetones, notamment la sulcotrione (EP 625 505, EP 625 
508, US 5,506,195). De tels genes codant pour une HPPD conferant une tolerance aux 

30 herbicides ayant pour cible l'HPPD sont decrits dans la demande de brevet WO 
96/38567. 

Parmi les genes codant pour une EPSPS appropriee conferant une resistance aux 
herbicides ayant l'EPSPS comme cible, on citera plus particulierement le gene codant 
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pour une EPSPS vegetale, en particulier de maTs, presentant deux mutations 102 et 106, 
decrit dans la demande de brevet FR 2 736 926, denomme ci-dessous EPSPS double 
mutant, ou encore le gene codant pour une EPSPS isolee d' Agrobacterium decrit par les 
sequences ID 2 et ID 3 du brevet US 5,633,435, denomme ci-dessous CP4. 
5 Parmi les genes codant pour une HPPD conferant une tolerance aux herbicides 

ayant pour cible l'HPPD, on citera plus particulierement l'HPPD de Pseudomonas et 
celle d'Arabidopsis, decrites dans la demande de brevet WO 96/38567. 

Dans les cas des genes codant pour EPSPS ou HPPD, et plus particulierement 
pour les genes ci-dessus, la sequence codant pour ces enzymes est avantageusement 
10 precedee par une sequence codant pour un peptide de transit, en particulier pour le 
peptide de transit dit peptide de transit optimise decrit dans les brevets US 5,510,471 ou 
US 5,633,448. 

Resistance aux Insectes 
Parmi les proteines d'interet conferant de nouvelles proprietes de resistance aux 
15 insectes, on citera plus particulierement les proteines Bt largement decrites dans la 
litterature et bien connues de Phomme du metier. On citera aussi les proteines extraites 
de bacteries comme Photorabdus (WO 97/17432 & WO 98/08932). 
Resistance aux Maladies 
Parmi les proteines ou peptides d'interet conferant de nouvelles proprietes de 
20 resistance aux maladies on citera notamment les chitinases, les glucanases, 1' oxalate 
oxydase, toutes ces proteines et leurs sequences codantes etant largement decrites dans 
la litterature, ou encore les peptides antibacteriens et/ou antifongiques, en particulier les 
peptides de moins de 100 acides amines riches en cysteines comme les thionines ou 
defensines de plantes, et plus particulierement les peptides lytiques de toutes origines 
25 comprenant un ou plusieurs ponts disulfures entre les cysteines et des regions 
comprenant des acides amines basiques, notamment les peptides lytiques suivants : 
1'androctonine (WO 97/30082 et PCT/FR98/01814, deposee le 18 aout 1998) ou la 
drosomicine (PCT/FR98/01462, deposee le 8 juillet 1998). 

Selon un mode particulier de realisation de l'invention, la proteine ou peptide 
30 d'interet est choisi parmi les peptides eliciteurs fongiques, en particulier les elicitines 
(Kamoun & al., 1993 ; Panabieres & al., 1995). 
Modification de la qualite 
On peut egalement citer les genes modifiant la constitution des plantes modifiees, en 
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particulier la teneur et la qualite de certains acides gras essentiels (EP 666 918) ou 
encore la teneur et la qualite des proteines, en particuliers dans les feuilles et/ou les 
graines desdites plantes. On citera en particulier les genes codant pour des proteines 
enrichies en acides amines soufres (Korit, A.A. & al., Eur. J. Biochem. (1991) 195, 329- 
5 334 ; WO 98/20133 ; WO 97/41239 ; WO 95/31554 ; WO 94/20828 ; WO 92/14822). 
Ces proteines enrichies en acides amines soufres auront egalement pour fonction de 
pieger et stocker la cysteine et/ou la methionine excedentaire, permettant d'eviter les 
problemes eventuels de toxicite lies a une surproduction de ces acides amines soufres en 
les piegeant. On peut citer egalement des genes codant pour des peptides riches en 

10 acides amines soufres et plus particulierement en cysteines, les dits peptides ayant 
egalement une activite antibacterienne et/ou antifongique. On citera plus 
particulierement les defensines de plantes, de merae que les peptides lytiques de toute 
origine, et plus particulierement les peptides lytiques suivants : randroctonine (WO 
97/30082 et PCT/FR98/01814, deposee le 18 aout 1998) ou la drosomicine 

1 5 (PCT/FR98/01462, deposee le 8 juillet 1998. 

Cellules vegetales et plantes transgeniques 

La presente invention concerne egalement des cellules vegetales et des plantes 
transformees comprenant au moins une cassette d'expression d'une HPP oxydase, d'une 
HGAH ou d'une HGAC telles que definies ci-dessus. 
20 Selon un premier mode de realisation de l'invention, les cellules vegetales ou les 
plantes comprennent une seule des cassettes d'expression selon l'invention choisie 
parmi les cassettes comprenant une sequence codante pour une HPP oxydase, une 
HGAH ou HGAC telles que definies precedemment. 

Selon un deuxieme mode de realisation de l'invention, les cellules vegetales ou les 
25 plantes comprennent deux cassettes d'expression selon l'invention choisies parmi les 
cassettes comprenant une sequence codante pour une HPP oxydase, une HGAH ou 
HGAC telles que definies precedemment associees deux a deux dans un meme vecteur : 
HPP oxydase et HGAH, HPP oxydase et HGAC, HGAH et HGAC. 

Selon un troisieme mode de realisation de l'invention, les cellules vegetales ou les 
30 plantes comprennent trois cassettes d'expression selon 1'invention, une premiere 
cassette d'expression de l'HPP oxydase, une deuxieme cassette d'expression de 
l'HGAH et une troisieme cassette d'expression de l'HGAC. 

Les cellules vegetales ou les plantes selon l'invention tellees que definis ci-dessus 
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peuvent egalement comprendre des cassettes d' expression d'autres proteines ou peptides 

d'interet definies precedemment. 

De maniere preferentielle, les cassettes d'expression sont integrees de maniere stable 

dans le genome des cellules vegetales ou des plantes. Plus preferentiellement, les 
5 plantes selon l'invention sont fertiles, les cassettes d'expression selon l'invention etant 

transferees a leur descendance. 

La presente invention concerne egalement des graines de plantes transgeniques ci- 

dessus, lesquelles graines compreiment une cassette d'expression selon 1' invention 

codant pour une HPP oxydase, une HGAH ou une HGAC. 
10 Les differentes cassettes d'expression dans les plantes transformees selon 

l'invention peuvent provenir soit de la meme plante transformee parente, et dans ce cas 

la plante est issue d'un seul procede de transformation/regeneration avec les differentes 

cassettes d'expression contenues dans un meme vecteur ou par co-transformation au 

moyen de plusieurs vecteurs. Elle peut egalement etre obtenue par le croisement de 
15 plantes parentes contenant chacune au moins une cassette d'expression selon 

1' invention. 

Transformation des cellules vegetales et des plantes 

L'invention a encore pour objet un procede de transformation des des cellules 
vegetales et des plantes par introduction d'au moins une sequence d'acide nucleique ou 

20 une cassette d'expression selon 1' invention telles que definies precedemment, 
transformation qui peut 6tre obtenue par tout moyen connu approprie, amplement decrit 
dans la litterature specialisee et notamment les references citees dans la presente 
demande, plus particulierement par le vecteur selon l'invention. 

Une serie de methodes consiste a bombarder des cellules, des protoplastes ou des 

25 tissus avec des particules auxquelles sont accrochees les sequences d'ADN. Une autre 
serie de methodes consiste a utiliser comme moyen de transfer! dans la plante un gene 
chimere insere dans un plasmide Ti d'Agrobacterium tumefaciens ou Ri 
dAgrobacterium rhizogenes. D'autres methodes peuvent etre utilisees telles que la 
micro-injection ou l'electroporation, ou encore la precipitation directe au moyen de 

30 PEG. L'homme du metier fera le choix de la methode appropriee en fonction de la 
nature de l'organisme hote, en particulier de la cellule vegetale ou de la plante. 

Lorsque Ton souhaite introduire plusieurs sequences d'acide nucleique ou cassettes 
d'expression, on peut le faire au moyen d'un seul vecteur selon l'invention comprenant 
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les differentes cassettes d' expression. Elles peuvent egalement etre introduites dans 
l'organisme hote par co-transformation au moyen de plusieurs vecteurs, chacun 
comprenant au moins une cassette d'expression. 

D'une maniere generate, les plantes transgeniques selon l'invention sont obtenues 
5 par transformation de cellules vegetales puis regeneration d'une plante, de preference 
fertile a partir de la cellule transformee. La regeneration est obtenue par tout procede 
approprie qui depend de la nature de l'espece, comme par exemple decrit dans les 
references ci-dessus. Pour les procedes de transformation des cellules vegetales et de 
regeneration des plantes, on citera notamment les brevets et demandes de brevet 

10 suivants: US 4,459,355, US 4,536,475, US 5,464,763, US 5,177,010, US 5,187,073, EP 
267,159, EP 604 662, EP 672 752, US 4,945,050, US 5,036,006, US 5,100,792, US 
5,371,014, US 5,478,744, US 5,179,022, US 5,565,346, US 5,484,956, US 5,508,468, 
US 5,538,877, US 5,554,798, US 5,489,520, US 5,510,318, US 5,204,253, US 
5,405,765, EP 442 174, EP 486 233, EP 486 234, EP 539 563, EP 674 725, WO 

15 91/02071 et WO 95/06128. 
Desherbage selectif 

L'invention a aussi pour objet un procede de desherbage selectif de plantes, 
notamment de cultures, a l'aide d'un inhibiteur de l'HPPD notamment un herbicide 
defmit auparavant, caracterise en ce qu'on applique cet herbicide sur des plantes 
20 transformees selon 1'invention, tant en presemis, en prelevee qu'en postlevee de la 
culture. 

La presente invention concerne egalement un procede de contr61e des mauvaises 
herbes dans une surface d'un champ comprenant des graines ou des plantes 
transformees selon l'invention, lequel procede comprend l'application dans la dite 

25 surface du champ d'une dose toxique pour les dites mauvaises herbes d'un herbicide 
inhibiteur d'HPPD, sans toutefois affecter de maniere substantielle les graines ou 
plantes transformee selon l'invention. 

La presente invention concerne egalement un procede de culture des plantes 
transformees selon l'invention lequel procede comprend le semis des graines des dites 

30 plantes transformees dans une surface d'un champ approprie pour la culture des dites 
plantes, l'application sur la dite surface du dit champ une dose toxique pour les 
mauvaises herbes d'un herbicide ayant pour cible l'HPPD defini ci-dessus en cas de 
presence de mauvaises herbes, sans affecter de maniere substantielle les dites graines ou 
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les dites plantes transformees, puis la recolte des plantes cultivees lorsqu'elles arrivent a 
la maturite souhaitee et eventuellement la separation des graines des plantes recoltees. 

Par « sans affecter de maniere substantielle les dites graines ou les dites plantes 
transformees », on entend selon rinvention que les plantes transformees selon 
5 1'invention soumises a une application d'une dose d'herbicide toxique pour les 
mauvaises herbes, presentent une phytotoxicite legere ou nulle. Par dose toxique pour 
les mauvaises herbes, on entend selon 1'invention une dose d'application de l'herbicide 
pour laquelle les mauvaises herbes sont tuees. Par phytotoxicite legere on entend selon 
1'invention un pourcentage de feuilles blanchies inferieur a 25%, preferentiellement 

10 inferieur a 10%, plus preferentiellement inferieur a 5%. II est entendu egalement selon 
la presente invention que 1' application de la meme dose toxique sur une plante 
autrement comparable non transformee, c'est a dire ne comprenant pas au moins une 
cassette d'expression selon 1'invention, conduirait a observer sur ladite plante des 
symptomes de phytotoxicite supperieurs a ceux observes pour la plante transformee 

15 selon 1'invention. 

Dans les deux precedes ci-dessus, l'application de l'herbicide ayant pour cible 
l'HPPD peut etre faite selon 1'invention, tant en presemis, en prelevee qu'en postlevee 
de la culture. 

Par herbicide au sens de la presente invention on entend une matiere active herbicide 
20 seule ou associee a un additif qui modifie son efficacite comme par exemple un agent 
augmentant l'activite (synergiste) ou limitant l'activite (en anglais safener). Les 
herbicides inhibiteurs d'HPPD sont en particulier definis auparavant. Bien entendu, 
pour leur application pratique, les herbicides ci-dessus sont associee de maniere en soi 
connue aux adjuvants de formulations utilises habituellement en agrochimie 
25 Lorsque la plante transformee selon 1'invention comprend un autre gene de tolerance 
a un autre herbicide (comme par exemple un gene codant pour une EPSPS mutee ou non 
conferant a la plante une tolerance au glyphosate), ou lorsque la plante transformee est 
naturellement insensible a un autre herbicides, le procede selon 1'invention peut 
comprendre l'application simultanee ou decalee dans le temps d'un inhibiteur d'HPPD 
30 en association avec ledit herbicide, par exemple le glyphosate. 

Les differents aspects de 1'invention seront mieux compris a l'aide des exemples 
experimentaux ci-dessous. 

Toutes les methodes ou operations decrites ci-dessous dans ces exemples sont 
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donnees a titre d'exemples et correspondent a un choix, effectue parmi les differentes 
methodes disponibles pour parvenir au meme resultat. Ce choix n'a aucune incidence sur 
la qualite du resultat et par consequent, toute methode adaptee peut etre utilisee par 
l'liomme de l'art pour parvenir au meme resultat. La plupart des methodes d'ingenierie 
5 des fragments d'ADN sont decrites dans Coligan et al. (1995), Ausubel et al. (1995) ; 
Maniatis et al. (1982), Sambrook et al. 

Les references bibliographiques citees precedement sont integrees par reference 
a la presente demande de brevet, en particulier les references bibliographiques 
definissant les sequences d'acide nucleique codant pour des HPPD natives, chimeres ou 

1 0 mutees, eventuellement combinees avec un peptide signal ou peptide de transit. 

Exemple I: IDENTIFICATION DU GENE CODANT L'HPP OXYDASE 
WARTHROBACTER GLOBIFORMIS 

L'HPP oxydase (HPPO) convertit l'HPP en 4-HPA par une reaction de 
decarboxylation. Cette enzyme catalyse done la premiere activite enzymatique 

15 necessaire pour la construction de la voie metabolique contournant l'HPPD. L'activite 
HPP oxydase a ete caracterisee dans des extraits bruts de Rhodococcus erythropolis SI 
(Suemori et al, 1995) ou dans un extrait partiellement purifi6e d'Arthrobacter 
globiformis (Blakley, 1977). A notre connaissance, la proteine n'a pas ete purifiee. Afin 
de pouvoir introduire cette activite enzymatique dans la plante, il est necessaire d'en 

20 identifier le gene. Differentes approches sont envisageables: (1) la mutagenese 
insertionnelle et done 1' identification du gene par la perte de l'activite enzymatique, (2) 
la complementation fonctionnelle d'un microorganisme en utilisant une banque 
genomique, (3) la purification de la proteine pour remonter a la sequence nucleique. 
Les trois approches furent utilisees. La complementation fonctionnelle et la mutagenese 

25 insertionnelle seront peu developpees, ces techniques n'ayant pas permis d'identifier le 
gene HPPO. 

1.1 Materiels et Methodes 
1.1.1- Les conditions de culture 

30 1. 1 . 1 . 1 - Les milieux riches 

Le milieu Luria-Bertani (LB; commercialise par Biol 01) est utilise pour cultiver 
les bacteries (E. coli, P. fiuorescens) lors des experiences de biologie moleculaire. Pour 
la culture d'A. sic >bifoTwis on preferera le milieu Columbia-ANC enrichi avec 5%de 
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sang de mouton (BioMerieux). Ce milieu riche contient deux antibiotiques (acide 
nalidixique et colimycine) inhibiteurs des germes a Gram negatif. Bien que les trois 
bacteries poussent sur milieu riche a 37°C, on cultive en general A. globiformis et P. 
fluoresce™ a 29°C. 
5 1.1.1.2- Le milieu de culture WlAg 

Le milieu de culture decrit par Blakley (1977) precipite, il faut done le filtrer 
avant utilisation. Nous avons change progressivement le milieu afin d'atteindre un 
milieu " minimal " optimal. Les facteurs consideres sont la vitesse de croissance d'A. 
globiformis et l'activite enzymatique de l'HPPO. Le milieu retenu (M^S) est un milieu 
10 M9 (Maniatis et al, 1982) legerement modifier Na2HP0 4 12 H 2 0 (6 g/L); KH 2 P0 4 (3 
g/L); NH 4 C1 (1 g/L); NaCl (0.5 g/L); CaCl 2 (6 mg/L); FeS0 4 7 H 2 0 (6 mg/L); extrait de 
levure (20 mg/L); et enfin le substrat (HPP ou tyrosine ou citrate) a la concentration 
lg/L. Le milieu est autoclave. Avant utilisation, lmLde MgS0 4 1 M sterile est ajoute 
par litre de milieu. 

15 Ce milieu minimum est aussi utilise pour cultiver P. fluorescens. 

1.1.2- Construction d'une banque genomique d'Arthrobacter globiformis 
II n'existe pas de technique fiable permettant de faire une banque de cDNA 
bacteriens complets. Nous avons done decide de creer une banque genomique 
d' Arthrobacter globiformis. Pour la realiser, nous choisissons le systeme cosmidique. 
20 La banque cosmidique tut realisee pour les experiences de complementation 
fonctionnelle, puis tut utilisee plus tard pour rechercher le ou les cosmides contenant le 
gene hppO. 

1.1.2.1- Le vecteur cosmidique pLAFR5 
1. 1 .2. 1 . 1 - Description du vecteur 
25 Nous choisissons le vecteur cosmidique conjugatif pLAFR-5 (Keen et al, 1988) 

qui peut recevoir un insert d'environ 20 kb. Pourvu d'une origine de transfert et d'une 
origine de replication a large spectre d'hote a Gram negatif, il peut etre transmis a 
d'autres genres bacteriens par conjugaison tri-parentale ce qui peut etre utile pour tester 
la complementation fonctionnelle chez differents genres bacteriens. II confere une 
30 resistance a la tetracycline. 

1. 1 .2. 1 .2- Preparation du vecteur 
Le plasmide pLAFR-5 est purifie par un protocole de lyse alcaline (Maniatis et 
al, 1982), traite a la RNAse puis digere par Bam HI et Sea I. La digestion par Bam HI 
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permet d'ouvrir le site dans lequel seront "ligues" les inserts d'ADN genomique digere 
par Sau3A. La digestion par Sea I permet de liberer les sites cos qui permettent 
l'encapsidation. Apres extraction phenolique puis chloroformique, l'ADN est precipite a 
l'ethanol. L'ADN sec est solubilise dans l'eau. Le vecteur ainsi prepare est conserve a - 
5 20°C. 

1.1.2.1- Preparation de l'ADN genomique <TA. globiformis 
Une culture de 24 heures (200 mL, 180 rpm, 29°C) realisee dans le milieu (200 
mL) decrit par Blakley (1977) est centrifugee a 3000 g a 4°C pendant 15 minutes. Le 
culot cellulaire, repris par 10 mL de solution de lyse (TE pH 8 ; 0,5 % SDS; 1 mg 

10 proteinase K), est incube a 37°C au bain-marie avec une agitation douce toutes les 20 
minutes. Au bout de 90 minutes, la suspension de cellules lysees est versee dans un tube 
JA-20 en polypropylene. On ajoute alors 10 mL de phenol/ chloroforme/ isoamylalcool 
(25/24/1) puis on centrifuge a 6 000 g pendant 15 minutes a 4°C. Le surnageant est 
alors transfere dans un nouveau tube JA20 auquel on ajoute 1,8 mL d'acetate 

15 d' ammonium 10 M et 10 mL d'isopropanol. Apres centrifugation a 20 000 g pendant 20 
minutes a 4°C, le culot est rince a l'ethanol 70 %. Le culot sec est repris avec 1 mL TE 
pH 8 puis transfere dans un tube Eppendorf de 2 mL auquel 10 uL de RNAse (10 
mg.mL' 1 ) sont additionnes. Apres 30 min a 37°C, 800 uL de phenol/ chloroforme/ 
isoamylalcool sont rajoutes. Apres centrifugation, le surnageant est transfere dans un 

20 nouveau tube Eppendorf et extrait avec 0,8 mL de chloroforme. Le surnageant est alors 
transfere dans un dernier tube Eppendorf auquel 200 uL d'acetate d'ammonium 10 M et 
800 uL d'isopropanol sont ajoutes. Apres centrifugation, le culot est rince a l'ethanol 
70% puis, une fois sec, repris dans 500 uL d'eau. L'ADN genomique est alors stocke a - 
20°C. 

25 1. 1 .2.3- Digestion menagee de l'ADN genomique d'A. globiformis 

Seuls les cosmides faisant 40-45 kb peuvent etre encapsides. Le vecteur faisant 
21,5 kb, les inserts d'ADN genomique d'A. globiformis doivent avoir une taille 
comprise entre 19 et 22 kb. Ces fragments sont obtenus en realisant une digestion 
menagee de l'ADN genomique d'Arthrobacter globiformis. Pour definir les conditions 

30 optimales de la digestion menagee nous realisons des digestions de l'ADN genomique 
d'A. globiformis avec des quantites variables d' enzyme de restriction Sau 3A. II apparait 
que la meilleure condition de digestion utilise 0,08 unite enzymatique Sau 3 A pendant 
30 minutes a 37°C. L'ADN genomique ainsi digere presente une taille comprise entre 
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15 et 22 kb. L'ADN genomique ainsi digere est extrait au phenol puis au chloroforme et 
enfin precipite a l'ethanol. 

1.1.2.4- Ligation de l'ADN genomique d'A. globiformis dans le vecteur 
cosmidique 

5 La reaction de ligation se fait dans un volume final de 10 uL, contenant 500 ng 

de pLAFR-5 digere par Bam HI et Sea I, 650 ng d' ADN genomique digere par Sau 3 A, 
320 unites de T 4 DNA ligase (N.E.B.) et 5 mM d'ATP. La ligation se deroule a 12°C 
pendant la nuit (environ 16 heures). Les 5 mM d'ATP permettent d'eviter les ligations 
entre les extremites tranches (Sea I) (Feretti & Sgaramella, 1981) de telle sorte que les 
10 dimeres de vecteurs n'ayant pas d'insert ne puissent pas s'encapsider dans la tete des 
phages X. 

1.1.2.5- Encapsidation des cosmides et amplification de la banque 
cosmidique 

L'encapsidation des cosmides, realisee en utilisant le kit GIGAPACK II XL 

15 (Stratagene) en respectant les instructions du fournisseur, assure une efficacite de 
transfection superieure a celles obtenues avec les techniques classiques de 
transformation. Pour amplifier la banque cosmidique, Keen et al. (1988) conseillent 
d'utiliser les Escherichia coli DH-1 et HB101. En effet, lorsque ces souches sont 
cultivees sur maltose, elles produisent une proteine membranaire qui permet une 

20 meilleure fixation du phage et done une transfection plus efficace des cosmides. La 
banque, amplifiee en suivant les recommandations de Stratagene, est conservee a - 
80°C. Pour evaluer la banque cosmidique, l'ADN plasmidique isole d'une trentaine de 
clone est digere par Apa I ou Eco RI. Les profils de restriction sont observes sur gel 
d'agarose a 0,8%. 

25 1.1.3- Purification de l'HPP oxydase 

1.1.3.1- Test colorimetrique de l'activite HPP oxydase 
Afin de pouvoir controler les etapes de purification, l'activite HPP oxydase est 
suivie en utilisant le test colorimetrique decrit par Blakley (1977). La reaction 
enzymatique est stoppee par 1'ajout de 2,4 dinitrophenylhydrazine (2,4-DNPH), en 

30 solution dans l'HCl 2 M. La 2,4-DNPH reagit avec la fonction cetone en alpha d'une 
fonction carboxylique (ex : l'HPP). II se forme ainsi une hydrazone que Ton peut reveler 
en alcalinisant le milieu. Lorsque l'HPP est convertit en totalite en 4-HPA pendant la 
reaction enzymatique, l'hydrazone ne peut pas se former, on obtient done, en milieu 
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basique, la couleur jaune caracteristique de la 2,4-DHPA. Si l'HPP n'est pas entierement 
convertit en 4-HPA lors de la reaction enzymatique, la formation d'hydrazone est 
possible. Ces hydrazones prennent une couleur brune en milieu basique. Une variation 
de coloration entre ces deux extremes est obtenue en fonction de la quantite d'HPP 
5 consomme. Les mesures d'absorption sont faites a 445 ou 450 nm. Afin de rendre ce test 
plus facilement manipulable, nous l'avons adapte au format microplaque a 96 puits. Le 
melange reactionnel comprend GSH (900 uM); HPP (135 uM); TPP (1,8 mM); MgCl 2 
(4,5 mM); FAD (4 uM); tampon phosphate de potassium (90 mM) pH 7,4. Le melange 
est conserve sur glace. Dans chaque puits on depose 50 uL de la fraction a tester et 150 

10 uL de melange reactionnel. Apres 20 min a 30°C, la reaction enzymatique est stoppee 
avec 13 uL de solution 2,4-DNPH (0.1% dans HC1 2 M). Laisser reagir 20 min a 
temperature ambiante. On revele la formation d'hydrazone en ajoutant 13 uL de 
solution NaOH 10 M. Pour realiser la gamme etalon, des melanges reactionnels avec 
des concentrations variables d'HPP sont prepares. Les 50 uL de fraction proteique sont 

1 5 remplaces par 50 uL de tampon d'extraction de la proteine. La courbe etalon est realisee 
pour chaque nouvelle solution de 2,4-DNPH (la solution de 2,4-DNPH est stable 6 mois 
a l'obscurite). L'avantage de ce test est sa rapidite, sa simplicite, mais il a le defaut de 
mesurer une disparition de substrat et non pas une apparition de produit. En outre, la 
possibilite d'avoir des faux positifs existe : une activite tyrosine amino-transferase 

20 donnera le meme resultat que l'activite de l'HPPO. En effet, dans les deux cas, la 
fonction cetone a disparu. Nous avons done developpe une methode HPLC rapide et 
sensible qui permette de confirmer la production de 4-HPA. 
1.1.3.2- Test d'activite analyse par HPLC 
Une methode HPLC a ete mise au point en utilisant une petite colonne 

25 Spherisorb ODS2 50 x 4,6 mm et de granulometrie 3 urn. La chromatographie est 
realisee en isocratique A: 90%; B: 10% (ou tampon A: H 2 0 0,1% TFA et tampon B: 
acetonitrile), debit 0,8 mL.min 1 et l'elution est suivie a 230 nm. Dans ces conditions, il 
est possible de separer le 4-HPA, l'HGA, le 3,4-DHPA et l'HPP en 5 minutes apres 
l'injection. La colonne a ete realisee a facon par Merck. 

30 1.1.3.3- Purification de la proteine 

Lors de la mise au point de ce protocole, un souci de simplicite a ete recherche. 

1.1.3.3.1- Tests preliminaires 
Les tests preliminaires ont pour but de determiner l'influence de composes 
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(NaCl, KC1, propanol-1, ethylene glycol, etc ...) et du pH sur l'activite enzymatique. 
Les reactions sont realisees avec des extraits bruts d'A. globiformis cultive sur milieu 
M4s contenant de la tyrosine comme seule source de carbone (M^g-tyrosine). Le 
compose a tester est ajoute dans le milieu reactionnel. Pour mesurer l'influence du pH 
5 sur l'activite enzymatique de l'HPPO, differents tampons phosphate sont realises. 
1.1.3.3.2- Protocole de purification 
La souche & Arthrobacter globiformis est etalee sur milieu gelose LB ou sur 
milieu gelose Columbia- ANC. Apres 16 heures de culture a 29°C, une colonie est 
prelevee et ensemencee dans 5 mL de milieu LB, en croissance pendant 8 heures a 

10 29°C, 180 rpm. 50 uL de cette preculture sont alors inocules dans 1,5 L de milieu MAS- 
Tyrosine ou M^S-HPP, la culture est alors realisee a 29°C, 180 rpm, dans des 
Erlenmeyer a ailettes (Belco). Apres 48 heures de culture, les cellules sont collectees par 
centrifugation a 5 000 g pendant 15 minutes a 4°C. Les cellules sont remises en 
suspension dans du tampon Tris-HCl 50 mM pH 7,4 puis centrifugees comme 

15 precedemment. Le culot est repris dans 2 mL de tampon Tris-HCl 50 mM pH 7,4. Les 
cellules sont soniquees (Vibra Cell, Sonic Materials INC., Connecticut, USA) pendant 
15 minutes, puissance 4, pulse de 30%, dans la glace fondante. Les debris insolubles 
sont 61imines par une centrifugation de 25 min a 20 000 g, 4°C. Le surnageant est 
recupere, il constitue "l'extrait brut". II peut etre congele dans l'azote liquide puis 

20 conserve a -80°C (pendant 6 mois sans perte apparente d'activite). L'extrait brut est 
charge, sans dessalage prealable, sur une colonne echangeuse faible d' anions 
'EMD/DEAE 650 S' (Merck) equilibree en tampon phosphate 50 mM pH 7,4. L'elution 
de l'activite enzymatique est obtenue en appliquant un gradient de concentration de 
NaCl (en solution dans un tampon phosphate 50 mM pH 7,4. Les fractions contenant 

25 l'activite enzymatique sont rassemblees. La solution proteique obtenue est diluee d'un 
facteur 2,7 avec du tampon phosphate 50 mM pH 7,4. Les proteines sont alors chargees 
sur une colonne (XK16, Pharmacia) echangeuse forte d'anions 'source Q' (30 mL, 
Pharmacia) prealablement equilibree avec un tampon phosphate 50 mM pH 7,4. Les 
fractions proteiques interessantes, identifies par l'activite enzymatique, sont 

30 rassemblees puis concentrees sur membrane UVIKON 10 kDa. L'extrait proteique 
resultant est alors dessale par la technique de gel-filtration en utilisant une colonne 
'PD10' (Pharmacia) equilibree en tampon phosphate 10 mM pH 7,4 et elue avec ce 
meme tampon. Les proteines sont alors deposees sur une colonne (XK9/15, Pharmacia) 
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d'hydroxyapatite (2 mL; Hydroxyapatite DNA grade Bio-Gel®HTP gel; Bio-Rad) 
equilibree avec 10 mM tampon phosphate pH 7,4. On elue l'activite enzymatique en 
appliquant un gradient phosphate. Les fractions contenant l'activite enzymatique sont 
rassemblees et concentrees. On conserve les proteines actives lorsque la concentration 
5 proteique est superieure a 1 mg/mL en ajoutant du FAD, GSH et glycerol afin d'obtenir 
les concentrations finales suivantes : 27 uM FAD, 110 uM GSH, 0,8% glycerol. Les 
proteines ainsi preparees peuvent etre congelees a -80°C pendant au moins 6 mois. 

1.1.3.3.3- Dosage des proteines 

Le dosage des proteines se fait selon la methode de Bradford (1976) en utilisant 
10 la y-globuline pour standard. 

1.1.3.3.4- Coloration des gels de proteines 

Les fractions proteiques sont analysees sur gel de polyacrylamide a 10 % selon la 
methode de Laemmli (1970). Apres migration, les proteines du gel sont colorees soit en 
utilisant la methode au Bleu de Coomassie (Chua, 1980) soit en utilisant la methode au 
1 5 nitrate d'argent (Schoenle et al, 1 984). 

1.1.4- Microsequencage proteique de I'extremite N-terminale et de peptides 

internes 

Le microsequencage de la proteine est realise en utilisant la methode d'Edman 
(Laursen, 1971). Pour obtenir les meilleurs resultats lors du sequencage, le gel est 
20 prepare le j our meme. 

1.1.4.1- Preparation du gel d'acrylamide et son electrophorese 
Les gels (8,5%, 10% ou 12%) sont realises selon la methode de Laemmli (1970) 
en utilisant le systeme de minigels d'Hoefer®. Les proteines sont diluees au tiers avec 
une solution 'bleu de depot denaturant' (Tris-HCl 150 mM pH 6,8; SDS 4 %; p- 
25 mercaptoethanol 2% (v/v); glycerol 3,3% (v/v); bleu de Bromophenol 0,03% qsp 10 mL 
d'eau milliQ). Apres avoir ete bouillies 5 minutes, les proteines sont chargees sur le gel 
d'acrylamide. La migration est realisee a temperature ambiante en utilisant un tampon 
de migration denaturant (Tris base 25 mM; glycine 250 mM; p-mercaptoethanol 
0,014% (v/v); SDS 0,1 %) et en appliquant une intensite de 15 mA par gel. 
30 1. 1 .4.2- Preparatifs pour le sequencage de I'extremite N-terminale 

Afin de pouvoir realiser le sequencage de 1'extremite N-terminale, le gel est 
transfere sur membrane PVDF (PROBLOTT® - Applied Biosystems) en utilisant la 
technique de transfert semi-sec. L'electrotransfert des polypeptides se fait en 30 minutes 
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a 300 mA avec l'appareil 'Semy Dry Electroblotter' (Bio-Rad) et dans un milieu a base 
de CAPS (tampon de transfert: CAPS 10 mM pH 1 1,0; methanol 10% (v/v)). Le tampon 
de transfert ne contient pas de glycine qui risquerait de "polluer" le sequencage. Apres 
le transfert, la membrane est rincee quelques secondes a l'eau milliQ. Elle est alors 
5 immergee quelques secondes dans une solution de coloration a base d'amido-schwarz 
(Aldrich; ref: 19,524-3). La solution est constituee de methanol 45% (v/v), d'acide acetique 
1% (v/v), d'amido-schwarz 0,1% (m/v) et d'eau 63,9% (v/v). Lorsque la bande 
correspondante a la proteine d'interet est visible, la membrane est rincee abondamment 
a l'eau milliQ puis elle est sechee a Fair. La partie de la membrane contenant la proteine 

10 d'interet (60 kDa) est decoupee et envoyee pour le sequencage. 

1.1.4.3- Preparatifs en vu du sequencage des peptides internes 
Pour visualiser les proteines dans le gel, on utilise un protocole de coloration a 
rAmido-Schwarz legerement different de celui utilise pour colorer la membrane PVDF. 
Apres migration, le gel est fixe deux fois trente minutes avec une solution constituee de 

15 methanol 50 %, d'acide acetique 10 %, d'eau milliQ 40 %. La coloration est realisee 
avec une solution constituee de methanol 45 %, d'acide acetique 10 %, d'eau 45 %, 
d'Amido-Schwarz 0,003 % (p/v). Les proteines apparaissent progressivement. Lorsque 
la coloration est suffisante pour reperer la proteine, le gel est rince abondamment a l'eau 
milliQ. La bande d'interet est decoupee puis deshydratee au speed-vac (Savant). La 

20 bande de gel, ayant perdue environ un tiers de sa longueur, est envoye pour le 
sequencage. Les peptides internes sont obtenus apres digestion de la proteine par 
l'endoprotease Lys-C (sequencing grade Boehringer). La proteine dans le gel de 
polyacrylamide est digeree dans 150 uL de tampon Tris-HCl pH 8,6 (0,1 M) contenant 
0,03% de SDS, a 35°C pendant 18 heures en presence de 0,4 |ig d'endoprotease Lys-C. 

25 La proteine digeree est injectee sur colonne HPLC DEAE-C18 (diametre 1 mm); les 
peptides sont elues en utilisant un gradient d'acetonitrile (de 2 a 75 %) contenant du 
TFA a 0,1%. L'endoprotease Lys-C clive specifiquement les polypeptides du c6te 
carboxylique des lysines. 

1.1.5.1- Validation theorique en utilisant le gene MndD d ' Arthrobacter 

30 globiformis 

Une partie (867 pb) du gene MndD est amplifie par PCR en utilisant les amorces 
'OZ-MndD-S711': ACGTCACCGA AGAGGATGAA AAC et 'OZ-MndD-AS1578': 
ACGGCCATTT CGGACTTTTC. La PCR est realisee en utilisant le programme suivant: 
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95°C 5 min; 25 cycles: 95°C 45 sec, 56°C 45 sec; 72°C 1 min; 72°C 5 min; 4°C en 
attente. Le melange reactionnel comprend 200 a 500 uM de dNTP, 20 a 200 ng d'ADN 
cosmidique ou genomique et 100 pmol de chaque amorce dans un volume final de 50 
uL. 

5 1. 1 .5.2- Identification par PCR d'une partie du gene codant l'HPP oxydase 

La PCR est realisee en utilisant le kit 'Advantage®-GC Genomic PCR' 
(Clontech). Ce kit comprend, entre-autres, un adjuvant a base de betame 'GC melt' et un 
melange de polymerases thermoresistantes - principalement avec de la Thermus 
thermophilus (Tth) -. L' amplification est realisee sur l'ADN genomique & Arthrobacter 

10 globiformis, en utilisant la programmation suivante : 94°C 5 min; 30 cycles: 94°C 20 
sec, 60°C 30 sec, 72°C 3 min; 72°C 6 min; 4°C en attente. Les conditions reactionnelles 
sont 400 uM dNTP, 50 ng d'ADN genomique, 100 pmol de chaque amorce, 'GC melt' 
IX, pour un volume reactionnel de 50 uL. Dans ces conditions, nous amplifions une 
bande de 937 pb que nous denommons Z2. 

15 L'amplification par PCR peut etre aussi realisee en utilisant la Tth d'Epicentre ou 

la Tbr {Thermus brockianus - Finnzyme). La Tbr est la seule polymerase 
thermoresistante testee a pouvoir realiser la PCR sans additifs (DMSO, glycerol, 
betai'ne) ; c'est en outre une enzyme de haute fidelite. 
1.1.6- Criblage de la banque cosmidique 

20 Le criblage de la banque cosmidique est realise en utilisant la technique des 

sondes froides marquees a la dioxygenine (Boehringer Mannheim, 1995). 

1.1.6.1- Preparation de la sonde Z2-Dig 

Le marquage de la sonde a la digoxygenine est faite par PCR dans un volume 
final de 50 uL, dans les conditions defmies au paragraphe II.5.2, sauf pour le melange 

25 de dNTP constitue par : dUTP-Dig 90 uM; dTTP 135 uM; dATP 225 uM; dCTP 225 
uM; dGTP 225 uM. On quantifie la sonde amplifiee en deposant 3uL de la reaction sur 
un gel agarose a 0,8%. II apparait un leger bruit de fond, c'est a dire que la PCR n'est 
pas suffisamment specifique. Afin d'eviter tous problemes ulterieurs, la totalite de la 
PCR est deposee sur gel et la bande d'interet est extraite en utilisant le kit Qiaex II 

30 (Qiagen). 

1.1.6.2- Transfer! de la banque cosmidique sur membrane Hybond N 

Le stock glycerol de la banque cosmidique realisee dans E. coli HB101 est 
utilise pour inoculer 2 mL de milieu LBT 15 . Apres 8 heures de croissance la DO 600 est 
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estimee; des dilutions en cascade sont realisees afin d'etaler environ 1000 clones par 
bofte (144 cm 2 ). Apres 16 heures de croissance a 37°C, les bacteries sont transferees sur 
des membranes Hybond N (Amersham) et lysees en suivant les recommandations de 
Boehringer Mannheim (1995). L'ADN libere est fixe a la membrane par exposition aux 
5 U.V. (120 mJ delivres en 45 sec - Stratalinker ; Stratagene). Les membranes sont 
debarassees des debris cellulaires en realisant le traitement a la proteinase K comme 
preconise par Boehringer Mannheim (1995). 

1.1.6.3- Prehybridation - hybridation - detection 
Les etapes de prehybridation et hybridation se font dans un sac dispose sur un 

10 plateau a bascule, en utilisant la technique d'hybridation avec la sonde marquee a la 
digoxygenine (Boehringer Mannheim, 1995). La prehybridation (5x SSC; 0,5% SDS; 
0,1% N-laurylsarcosine; 1% agents bloquants (Boehringer Mannheim, ref: 1096 176); 
100 ug.mL" 1 sperme de saumon sonique et denature) est realisee pendant 4 heures a 
65°C. L'hybridation de la membrane est faite pendant la nuit a 68°C (milieu 

15 prehybridation frais contenant 20 ng.mL"' de sonde marquee a la digoxygenine et 
denaturee pendant 5 min a 100°C). Le lendemain, l'exces de sonde et les hybridations 
aspecifiques sont eliminees par quatre lavages avec le tampon A (0,5x SSC ; 0,1% SDS, 
65°C). Les membranes sont alors equilibrees pendant 5 min a temperature ambiante 
dans le tampon B (acide malique 138 mM, NaCl 142 mM, ajuste a pH 7,5 avec des 

20 pastilles de soude, 0,3% tween 20). Puis elles sont saturees par des agents bloquants 
(Boehringer Mannheim) durant 30 minutes avant d'etre hybridees avec l'anticorps Anti- 
Digoxigenine couple a la phosphatase alcaline ('Anti-Digoxigenine-AP, Fab fragments' ; 
Boehringer Mannheim) dilue au 1/10000 dans une solution fraiche d'agents bloquants. 
Apres 30 minutes, les membranes sont rincees deux fois 15 minutes dans du tampon B, 

25 puis equilibrees 5 minutes dans le tampon reactionnel de la phosphatase alcaline (Tris 
0,1 M; NaCl 0,1 M; MgCl 2 0,05 M pH 9,5). Les membranes sont recouvertes avec 1 mL 
de CSPD pret a l'emploi puis incubees 15 min a 37°C. Cette etape a 37°C permet une 
activation rapide de la phosphatase alcaline couplee a l'anticorps. On revele les 
membranes en exposant des Hyperfilm® ECL (Amersham) pendant 1 a 15 minutes. 

30 1.1 .6.4- Analyse des cosmides positifs par Southern et PGR 

Les cosmides identifies lors de Fhybridation sur membrane sont confirmes par 
PCR et par la technique de Southern. Dans ce cas, l'ADN cosmidique, purifie par lyse 
alcaline (Maniatis et ah, 1982), est digere par des enzymes de restriction puis separe sur 
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gel d'agarose a 0,8 %. Les gels sont transferee sur membrane Hybond N + (Amersham) 
par la technique de Southern en 20x SSC (Ausubel et ah, 1995). Apres transfert, la 
membrane est rincee au 2x SSC, puis l'ADN est fixe a la membrane grace aux U.V. 
(120 mJ delivres en 45 sec - Stratalinker ; Stratagene). La membrane est alors revelee 
5 en utilisant la technique de sonde froide decrite precedemment. 

1.1.7- Vecteurs de clonage et bacteries hotes 

Les sequences d'ADN amplifiees par PCR sont generalement clonees dans le 
plasmide p-GEMT-easy (Promega) qui permet un criblage par le technique "bleu- 
blanc". Pour la surexpression, on utilise le plasmide pKK223-3 (Pharmacia) qui place le 
10 gene sous la dependance d'un promoteur tac. Les clonages sont generalement realises 
en utilisant E. coli DH5a (New England Biolabs) ou E. coli XL1 Blue (Stratagene). 
Pour la surexpression on preferera E. coli BL21(DE3). 

1.1.8- Activite enzymatique de l'acetolactate synthase (ALS) 

L'activite acetolactate synthase (ALS) est mesuree en utilisant la methode 

15 colorimetrique decrite par Chang et Duggleby (1997). Les reactions sont conduites en 
microplaques avec un volume total de 250 uL. Pour chaque reaction, 25 uL d' enzyme 
sont incubees 30 min a 37°C dans 225 uL de milieu reactionnel constitue de KPi 50 
mM pH 7,0; pyruvate de sodium 50 mM ; TPP 1 mM ; MgCl 2 10 mM ; FAD 10 uM. La 
reaction est arretee par ajout de 25 uL d'H 2 S0 4 10 %. Les microplaques alors sont 

20 incubees a 60°C pendant 15 min. Puis on ajoute 250 uL de creatine 0,5 % et 250 uL 
d'oc-naphtol a 5 % dans du NaOH 4 M (la solution d'cc-naphtol doit etre preparee moins 
de 10 min avant usage). La microplaque est alors incubee 15 minutes a 60°C puis 15 
minutes a temperature ambiante. Une couleur rouge cerise apparait. La lecture est 
realisee a 525 nm (s M = 22 700 M _1 cm" 1 ). 

25 1.2- Resultats - Discussion 

L'HPP oxydase est la premiere activite enzymatique que nous souhaitons 
introduire dans la plante dans le cadre de la creation de la voie metabolique contournant 
l'HPPD. Afin de pouvoir identifier le gene codant l'activite HPP oxydase differentes 
approches furent developpees: (1) la mutagenese insertionnelle et done l'identification 

30 du gene par la perte de l'activite enzymatique, (2) la complementation fonctionnelle 
d'un microorganisme en utilisant une banque genomique, (3) la purification de la 
proteine pour remonter a la sequence nucleique. C'est la troisieme voie qui a ete 
preferee. 
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1.2.1- Purification de l'HPPO 

1.2.1.1- Optimisation des conditions de culture 
Avant de commencer a purifier la proteine, il est utile de determiner quels sont 
les conditions de culture qui permettent son expression dans la bacterie. Les resultats 
5 d'optimisation des conditions de culture montrent que l'activite HPP oxydase n'est pas 
detectable lorsque la croissance d' A. globiformis est faite au depend d'une source de 
carbone telle que le succinate, le fumarate ou le glucose. Par contre l'activite HPP 
oxydase est detectee lorsqu' A. globiformis est cultive en utilisant l'HPP, la tyrosine ou 
la phenylalanine comme seule source de carbone. Si Ton augmente la quantite d'extrait 

10 de levure (par exemple 200 mg.L" 1 au lieu de 20 mg.L" 1 ) on observe une diminution de 
l'activite enzymatique produite. Sur la base de ces observations, le milieu M As est 
defini. Enfm, on observe qu'une culture a forte densite (en debut de phase stationnaire ; 
DO 600 ~ 1) presente une activite enzymatique HPP oxydase plus faible que dans le cas 
d'une culture en phase exponentielle de croissance (DO 600 ~ 0,4). 

15 1.2.1 .2- Tests preliminaires 

Nous venons de definir le milieu optimal pour la production de l'HPPO, nous 
allons maintenant rechercher les conditions qui n'alterent pas la stabilite de l'activite 
HPP oxydase lors des processus de purification. Pour les chromatographies impliquant 
les resines echangeuses d' anions et les chromatographies en fonction du pH, il est 

20 important de connaitre la sensibilite de l'enzyme au pH et aux sels. Nous observons que 
le pH optimum est compris entre pH 7,0 et 7,8 ainsi que l'avait deja demontre Blakley 
(1977). L'enzyme semble peu sensible aux sels (NaCl et KC1) puisqu'il faut des 
concentrations superieures a 750 mM pour observer une baisse de l'activite 
enzymatique. Nous connaissons maintenant les conditions permettant une bonne 

25 expression de l'activite enzymatique et nous avons determine la sensibilite de l'activite 
HPP oxydase a des facteurs pouvant intervenir lors de la purification. La purification de 
l'HPPO peut done commencer. 

1.2.2.3- Purification de l'HPPO 
Pour purifier l'HPPO, on applique le protocole decrit precedemment. L'activite 

30 enzymatique est eluee de la DEAE EMD 650S avec 150 a 200 mM de NaCl en solution 
dans un tampon phosphate 50 mM pH 7,4. Les fractions contenant l'activite 
enzymatique sont rassemblees et conservees pendant la nuit a 4°C. En effet la 
congelation a cette etape entraine une perte d'activite. Les proteines sont ensuite 
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chargees sur une resine Source Q. L'activite enzymatique est alors eluee avec une 
concentration en NaCl comprises entre 150 et 200 mM en solution dans un tampon 
phosphate 50 mM pH 7,4. Les fractions contenant l'activite enzymatique sont 
rassemblees puis concentrees sur membrane UVIKON 10 kDa, et conservees a 4°C 
5 pendant la nuit. Enfin l'HPPO est purifiee lors d'une troisieme etape en appliquant un 
gradient phosphate sur colonne d'hydroxyapatite. L'activite est eluee avec une 
concentration de phosphate voisine de 30 mM. Les fractions contenant l'activite 
enzymatique HPP oxydase, en sortie de colonne d'hydroxyapatite, sont alors analysees 
sur un gel SDS-PAGE a 8,5% colore au nitrate d'argent. Le gel presente revolution de 

10 deux bandes proteiques. Par comparaison entre le profil d'activite enzymatique et le 
profil d'elution des proteines, nous considerons que l'HPPO correspond a la proteine de 
plus haut poids moleculaire (environ 60 kDa). Dans l'essai presente, la purification est 
initiee avec 1,5 g de proteines solubles extraites d'A. globiformis et nous avons recupere 
150 ug d'un melange de proteines (dont environ 70 ug d'HPPO). Le facteur de 

15 purification en terme d'activite specifique n'a pas ete determine. En effet, nous utilisons 
des conditions de reaction totale pour suivre l'elution de l'activite enzymatique. En 
outre, la problematique etait davantage l'identification de la proteine que la mise au 
point d'un protocole de purification. L'analyse HPLC, des reactions faites au sortir de 
chaque etape de purification, montre l'apparition d'un produit qui presente le mSme 

20 temps de retention que le standard 4-HPA (SIGMA). Quarante picomoles de la proteine 
HPPO (60 kDa) sont transferees sur une membrane PVDF et sont envoyees pour le 
sequencage en meme temps que 40 pmol de la proteine incluse dans le gel d'acrylamide. 
Les proteines transferees sur membranes servent a determiner la sequence N-terminale 
tandis que les proteines incluses dans le gel sont utilisees pour determiner la sequence 

25 de peptides internes. 

1.2.2.4- Resultats de sequencage de l'HPPO 
Peu de peptides internes sont obtenus en sortie d'HPLC apres digestion de 
l'HPPO par l'endoprotease Lys-C. Ce resultat suggere que la proteine contient peu de 
lysine , en effet l'endopeptidase Lys-C coupe apres les lysines. Si la lysine est peu 

30 frequente, la digestion par l'endopeptidase K genere des fragments peptidiques longs qui 
restent adsorbes dans la colonne et ne peuvent pas etre elues, meme en utilisant des 
conditions tres hydrophobes. En se basant sur la forme des pics chromatographiques 
ainsi que sur la quantite apparente, on selectionne puis on sequence trois peptides. Leur 
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denomination est fonction de leur ordre de sortie de la colonne HPLC: peptide N°4, 
peptide N°6, peptide N°ll. Leur sequence est respectivement: (A) WWAEALK, 
AAAGRILRLL DDAAGANASK, XDNRFTAVDF XT (ou X est un acide amine non 
determine). La sequence des 30 premiers acides amines N-terminaux est obtenue avec 
5 un rendement initial de 40 %: TSLTVSGRVA QVLSSYVSD VFGVMGNGNV Y. L'acide 
amine (methionine ou valine) correspondant au codon initiation (ATG ou GTG) n'est 
pas retrouve. Le rendement initial obtenu (15 pmol equivalent BSA), compare avec 
celui obtenu pour les peptides internes (30 a 35 pmol equivalent BSA), suggere qu'une 
partie des proteines etaient bloquees en N-terminal. La sequence N-terminale et les 
10 sequences internes obtenues ne presentent aucune homologie dans les bases de donnees. 
En nous basant sur les sequences peptidiques obtenues, des oligonucleotides degeneres 
sont synthetises afin d' identifier le gene HPPO par PCR. 

1.2.3- Validation des techniques PCR et identification d'une partie du gene 

hppO 

15 1.2.3 . 1 - Validation des techniques PCR 

La teneur en base guanine et cytosine (GC %) de la majorite des ADN 
genomiques des Arthrobacter sp. est comprise entre 59 et 66 %, cependant il est de 67 a 
69 % pour A. agilis (anciennement Micrococcus agilis) (Koch et al, 1995), de 70 % 
pour A. atrocyaneus (Jones et al, 1991) et de 73 % pour un Arthrobacter sp. identifie 

20 dans les glaces arctiques (Junge et al, 1998). Ces fortes teneurs en guanine et cytosine 
peuvent rendre plus difficile la mise en oeuvre de la PCR. Pour cette raison que nous 
avons valide nos methodes PCR (ADN genomique, polymerases, . . .) en utilisant le gene 
codant la 'Manganese dependent Dioxygenase' {MndD) d' Arthrobacter globiformis 
(Boldt et al, 1995). Cette enzyme de la voie de degradation de l'HPP catalyse 

25 rouverture du cycle aromatique du 3,4-dihydroxyphenylacetate. Pour 1' amplification 
controle du gene MndD, nous avons teste des polymerases thermoresistantes de 
thermophilus aquaticus (Taq) commercialisees par differents fournisseurs (Perkin 
Elmer, ATGC, Appligene, Qiagen, Sigma). Dans tous les cas, ramplification du gene 
MndD est obtenue. Cependant, dans des conditions equivalente, en utilisant les amorces 

30 degenerees codant les peptides de l'HPPO, 1' amplification du gene hppO n'est pas 
obtenue meme en utilisant des additifs (DMSO, glycerol). 

1.2.3.2- Identification par PCR de la partie N-terminale du gene hppO 
Nous amplifions de maniere specifique une sequence d'ADN de 936 pb qui 



WO 02/36787 ^ PCT/FR01/03364 

pourrait correspondre a la partie N-terminale du gene hppO. L' amplification est obtenue 
en utilisant d'une part les amorces degenerees 0x3: TTNGCNCCNG CNGCRTCRTC et 
OZ10N: GAYGTNTTYG GNGTNATGGG NAAYGG correspondant respectivement a une 
partie du peptide N°6 et a une partie de la sequence peptidique N-terminale et d' autre 
5 part le kit 'Advantage GC Genomic PCR' (Clontech). Le kit de Clontech est concu pour 
realiser des PCR sur des genomes riches en bases GC. II contient un melange de 
polymerases thermoresistantes (dont la Tth) et un additif a base de betaine. La Tth est 
une polymerase thermoresistante purifiee a partir de Thermits thermophilics. La 
degenerescence de chaque amorce est de 1024; c'est a dire qu'une amorce sur 1024 

10 presente la sequence nucleique exacte du gene recherche. La degenerescence provient 
du fait qu'un acide amine peut etre code par plusieurs codons, pour exemple, l'alanine 
est codee par quatre codons (GCA, GCC, GCG, CGT). Le code de degenerescence 
utilise pour les amorces est defini comme suit : N = A ou T ou G ou C ; R = A ou G ; Y 
= T ou C. Les temperatures theoriques d'hybridation sont respectivement de 55,4°C et 

15 57,6°C. Malgre une temperature d'hybridation de 60°C utilisee lors de la PCR, l'amorce 
OX3 seule permet des amplifications non specifiques. Nous avons amplifie par PCR un 
fragment d'ADN de 936 pb de maniere specifique en utilisant deux amorces degenerees. 
Nous devons nous assurer que cet ADN amplifie correspond bien au gene hppO 
recherche. 

20 1.2.4- Caracteristique du fragment d'ADN de 936 pb 

Le fragment d'ADN de 936 pb, amplifiee par PCR, est purifie sur gel d'agarose. II 
est alors clone dans pGEM-T easy, selon les instructions du fournisseur, puis sequence. 
Lorsque Ton traduit la sequence nucleique obtenue, on observe qu'elle code aux deux 
extremites pour la totalite du peptide N°6 et pour une bonne partie de la sequence N- 

25 terminale. Nous sommes done sur d'avoir amplifie une partie du gene codant la proteine 
purifiee et microsequencee, l'HPPO. La sequence nucleique contient 73% de bases 
guanine (G) et cytosine (C) on note en outre la possible formation de structures 
secondaires dites "en epingles a cheveux" (stem-loop) dans les 250 premieres bases de 
l'ARN messager. Cette haute teneur en bases G et C ainsi que l'existence de ces 

30 structures secondaires peuvent expliquer en partie les difficultes rencontrees pour 
parvenir a ramplification par PCR d'une partie de ce gene. La sequence nucleique de 
936 pb ainsi que la sequence proteique correspondante ne presentent pas d'homologies 
avec les sequences enregistrees dans les bases de donnees. Nous possedons maintenant 
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io 

une sequence de 936 pb, orientee de N-terminal vers le peptide interne N°6. La proteine 
faisant environ 60 kDa, nous recherchons un gene d' environ 1650 pb. II reste done a 
identifier environ 700 pb. Pour cela nous allons cribler la banque genomique d'A. 
globiformis realisee dans le cosmide pLAFR5 et amplifiee dans E. coli HB101. 
5 1.2.5- Criblage de la banque cosmidique d'A globiformis 

La banque genomique realisee est transferee sur membrane, puis criblee en 
utilisant, comme sonde, le fragment d'ADN de 936 pb marque a la digoxygenine. Le 
protocole standard est adapte pour un ADN "classique" (60% AT), tandis que le 
fragment de 936 pb presente une proportion estimee de 23% AT. Si nous gardons le 

10 meme rapport dUTP-Dig/dTTP que dans le cas d'un ADN classique nous obtenons une 
sonde faiblement marquee done une detection moins sensible. Nous avons done 
optimise la proportion dUTP-Dig/dTTP necessaire pour le marquage de la sonde 
(paragraphe II.7.1). Le criblage de la banque genomique a permis d'identifier quatre 
cosmides (CoslA, Cos2A, Cos4A, Cosl7Al) ayant des profils de restriction differents. 

1 5 En comparant les resultats d'hybridation de Southern obtenus a partir des cosmides avec 
ceux obtenus a partir de l'ADN genomique d'Arthrobacter globiformis, nous 
selectionnons le cosmide 2A. La figure N°14 illustre la demarche utilisee en prenant 
pour exemple la digestion des cosmides par 1'enzyme de restriction Not I. Nous 
observons tout d'abord que le vecteur cosmidique pLAFR5, digere par Not I, n'hybride 

20 pas avec la sonde Z2-Dig. Par contre, nous observons que le cosmide 1A presente une 
seule bande d'hybridation a 2,3 kb alors que les cosmides 2 A, 4A et 17A presentent 
deux bandes d'hybridation a 4,3 et 2,3 kb. Or la digestion du genome d'A. globiformis 
par Not I produit deux bandes de 4,3 et 2,3 kb; de fait nous considerons que le cosmide 
1A ne contient pas toute 1' information que nous recherchons. En nous basant sur 

25 d'autres restrictions et en utilisant une demarche equivalente nous eliminons les 
cosmides 4A et 17A. Le Cosmide 2A est alors sequence sur une distance d'environ 3 kb 
de part et d'autre du site Not I identifie au milieu de la sonde Z2-Dig. Les resultats 
d'hybridation de l'ADN genomique montrent en outre que le gene est present a une 
seule copie. Nous avons identifie le cosmide 2A que nous avons fait sequencer sur 6,2 

30 kb. Nous allons maintenant pouvoir analyser cette sequence d'ADN issue de genome 
d'Arthrobacter globiformis. 

1.2.6- Analyse globale de 6,2 kb d'ADN genomique VArthrobacter 
globiformis. 
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En utilisant le logiciel Vector Nti, la position des genes potentiels est definie a 
partir de la sequence nucleique de 6255 pb obtenue en sequen9ant le cosmide 2A. Nous 
retrouvons la sequence de 936 pb, identifiee par PCR, comme faisant partie d'un gene 
potentiel. Ce gene potentiel correspond done vraisemblablement au gene hppO. Quatre 
5 autres genes (A, B, C, D) sont potentiellement identifies (Figure 3) en effectuant une 
recherche par homologie en utilisant ralgorithme BLASTX. Le gene A coderait un 
transporteur d'acide amines, le gene B coderait une histidinol-phosphate 
aminotransferase cependant de precedents travaux montrent que cette enzyme possede 
l'activite tyrosine aminotransferase chez la bacterie a Gram positif Bacillus subtilis 
10 (Nester & Montoya, 1976), le gene C coderait un regulateur de transcription, tandis que 
le gene D coderait un regulateur d'operon. 



1.2.7- Analyse du gene hppO 
15 1.2.7. 1 - Description generale 

Sur la sequence obtenue de 6256 pb, le gene hppO (en vert) est delimite en 5' par le 
codon d'initiation ATG en position 3143 et en 3' par le codon stop TAG (en rouge) en 
position 4823. Le gene presente done une longueur reelle de 1680 pb. II presente une 
forte teneur en bases G et C (71,4 % GC). La recherche d'homologies au niveau des 
20 sequences nucleiques (BLASTN), ne permet aucune identification. Afin de mieux 
caracteriser le gene, nous recherchons les elements specifiques de la transcription et de 
la traduction. 

1.2.7.2- Elements caracterisant la transcription et la traduction du gene hppO 
Nous identifions les potentielles boites promotrices de la transcription (Figure 4). La 

25 boite «-10», dite «boite de Pribnow», est situee entre les positions 3082 a 3088 
(AAAAATA) et la boite « -35 » est situee en position 3055 a 3059 (TTGCA). Les 
boites ainsi definies sont legerement differentes des sequences canoniques 
(respectivement TATAAT et TTGACA ; Singer & Berg, 1992). Cela peut refleter une 
interaction faible avec les facteurs permettant la transcription constitutive ou bien la 

30 necessaire interaction avec des facteurs de transcription differents. L'adenine en position 
3096 pourrait etre la base d'initiation de la transcription. Enfin nous identifions entre les 
positions 3068 a 3072 (TGTGA) une sequence correspondant au site d'attachement de 
la proteine CAP (catabolic gene activator protein). Le fait de retrouver ce site de 
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fixation de la proteine CAP va dans le sens des resultats obtenus lors de 1' optimisation 
des conditions de culture. En conclusion la transcription du gene hppO est 
vraisemblablement sous le controle d'un promoteur faible, notamment regule par le 
glucose. La sequence de Sbine-Dalgarno (Singer & Berg, 1992) permet la fixation de la 
5 petite sous unite ribosomique. Elle est identified (GACGAT; en position 3131 a 3136) 
12 bases en amont du codon d' initiation (ATG) de la traduction, par analogie avec la 
sequence consensus AGGA. On observe en outre que la partie 5' terminale (environ 
250 bases) de l'ARN messager est capable de se structurer en epingle a cheveux (stem- 
loop). Or la structure secondaire de la region de l'ARNm qui avoisine l'ATG initiateur 
10 influence l'etape d'initiation de la traduction. Ainsi 1'initiation est nulle ou peu efficace 
lorsque l'ATG initiateur ou la sequence Shine-Dalgarno sont impliques dans un 
appariement intramoleculaire. On peut done se poser la question d'un eventuel role 
regulateur de la traduction des structures en epingle a cheveux observees. 

1 5 1.2.7.3- Expression de l'HPPO sous la dependance du promoteur tac 

La surexpression de l'HPPO est interessante pour definir les caracteristiques 
cinetiques, pour permettre la production d'anticorps, mais aussi en vu de l'analyse 
structurale. Le gene est clone dans un vecteur pKK223-3 en deux etapes. Le gene, 
amplifie par PCR dans les conditions definies pour 1' identification du gene hppO et en 

20 utilisant les amorces HPP-N-sens (CAT GACT T C A CTTACAGTGT CC) et HPP-C-term 
(CAAACTGAGT AGCAGCTCAG G), est clone dans le vecteur pGEMT-easy. On 
selectionne le clone presentant le gene hppO en antisens du promoteur lac. On le digere 
alors par Eco RI. Ce faisant on recupere le gene hppO que Ton insert dans le vecteur 
pKK223-3 digere par Eco RI. Le clone pKK3-2, presentant le gene hppO sous le 

25 controle du promoteur tac, est retenu. Lorsque Ton induit l'expression du clone pKK3-2 
par l'ajout d'IPTG, on peut detecter une activite HPP oxydase. Cependant la proteine 
surexprimee (57,4 kDa) n'est pas decelable dans un extrait brut separe sur gel 
acrylamide denaturant. II reste done a ameliorer le protocole de surexpression. Nous 
envisageons en outre de doner l'HPPO en fusion avec une sequence Tag, (GST, poly- 

30 histidine, proteine A....) afin de faciliter la purification de la proteine surexprimee. 
Nous venons definitivement de montrer que le gene identifie codait une activite HPP 
oxydase. Cependant, en realisant des recherches d'homologie au niveau des sequences 
proteiques (BLASTX ou BLASTP), nous observons que la proteine HPPO presente 
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jusqu'a 25% d'identite avec des acetolactate synthases (ALS), des pyruvate oxydases 
(POX) et des pyruvate deshydrogenases (PDH). II est ainsi possible d'identifier des 
motifs tres conserves tel ceux concernant la fixation du cofacteur TPP (Figure 5). En 
outre le profil d'hydrophobicite de PHPPO est tres proche de celui obtenu pour des ALS 
5 (non montre). Afin d'etre sur que le gene identifie code reellement l'HPPO et non pas 
une ALS, une POX ou une PDH ayant une activite annexe de type HPP oxydase, nous 
decidons de tester l'HPPO pour une eventuelle activite annexe. 
1.2.8- HPPO versus ALS 

Les recherches d'homologies proteique montrent que l'HPPO presente jusqu'a 

10 25% d'identite avec des ALS. Ce resultat, bien que surprenant au premier abord, 
presente une certaine logique. En effet ces deux enzymes utilisent le FAD et le TPP 
comme cofacteurs reactionnels. Elles realisent toutes deux une decarboxylation. Par 
ailleurs, l'un des substrats de l'ALS est le pyruvate, or notre substrat un pyruvate p 
substitue : l'hydroxyphenylpyruvate. II est done possible que la structure du site actif 

15 soit voisine et que par consequence ces proteines partagent des activites enzymatiques 
communes. Nous avons utilise la grande sous-unite recombinante et purifiee des ALS 
d'Arabidopsis thaliana (Chang & Duggleby, 1997) et de E. coli (Hill & Duggleby, 
1998) pour servir de contrdle positif dans nos experiences realisees pour rechercher une 
activite ALS chez l'HPPO. Les resultats obtenus montrent que l'HPPO ne presente pas 

20 d'activite ALS. Nous montrons aussi a cette occasion que les deux ALS testees n'ont 
pas d'activite HPP oxydase. Enfin nous observons que l'HPPO n'est pas inhibe par 1 15 
ppm d'imazapyr (inhibiteur d'ALS, Cyanamid). Ces resultats montrent que bien qu'en 
depit de points communs (sequence proteique et hydrophobicite) les ALS et l'HPPO 
sont des enzymes bien distinctes, n' ayant pas d'activites enzymatiques secondaires. 

25 Exemple 2 IDENTIFICATION DES GENES CODANT LA 4-HPA 1- 
HYDROXYLASE 

La 4-HPA 1 -hydroxylase (HP AH) convertit le 4-HPA en HGA par une reaction 
d'hydroxylation accompagnee par un deplacement de la chaine acetyle. Son activite a 
ete caracterisee sur extraits bruts de Rhodococcus erythropolis Sl(Suemori et ah, 1995) 
30 ou sur extrait partiellement purifies de P. acidovorans (Hareland, 1975). Elle a ete 
purifiee par Suemori et al. (1996) cependant les sequences proteique et genetique ne 
sont pas publiees. Afin de pouvoir introduire cette activite enzymatique dans la plante, il 
est necessaire d'identifier le gene. 
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Differentes approches sont envisageables: (1) la complementation phenotypique 
et/ou fonctionnelle en utilisant une banque genomique, (2) la mutagenese insertionnelle 
et done 1' identification du gene par la perte de l'activite enzymatique, (3) la purification 
de la proteine pour remonter a la sequence nucleique. Nous avons choisi de developper 
5 ces trois approches avec Pseudomonas acidovorans car il y a de nombreux outils de 
biologie moleculaire dont l'efficacite a ete demontree sur differentes especes et souches 
de Pseudomonas. A titre d'exemples nous pouvons citer le transposon mini-Tn5 (De 
Lorenzo et ah, 1990), les vecteurs large spectre d'hote tels pBBRlMCS (Kovach et ah, 
1994, 1995; D'Souza et ah, 2000), les techniques de transfert par conjugaison. Le 

10 transposon mini-Tn5 peut etre utilise soit pour perturber un gene (de Lorenzo et ah, 
1990 ; Fedi et ah, 1996 ; Campos-Garcia et ah, 2000) soit pour introduire un gene dans 
le genome bacterien (Prieto et ah, 1999). Nous avons commence" par l'approche par la 
complementation phenotypique car e'est ce qui paraissait le plus rapide et le plus 
simple. Cette approche a ete suivie par les deux autres simultanement. Cependant, nous 

1 5 n'aborderons pas ici l'approche par mutagenese insertionnelle, cette voie n'ayant pas ete 
exploitee par la suite. 
II.1- Materiels et Methodes 

11.1.1- Construction d'une banque genomique de P. acidovorans dans E. coli 
Pour construire la banque nous utilisons le cosmide pLAFR5 et 1' ADN genomique 

20 de P. acidovorans. Nous utilisons la souche hote E. coli HB 101. 

11.1.2- Purification de la 4-HPA 1-hydroxylase 
II. 1.2.1- Test d'activite spectrophotometrique 

Dans la reaction catalysee par la 4-HPA 1-hydroxylase, decrite par Hareland et 
ah (1975), il y a consommation d'oxygene moleculaire et de NADH,H + . Nous avons 

25 choisi de mesurer l'activite enzymatique en suivant l'oxydation du NADH,If" en NAD + . 
Le milieu reactionnel comprend: NADH,H + 300 uM; FAD 6,7 uM; KPi 100 mM; DTT 
1 mM; 10 a 50 ug de proteines. La reaction est declenchee par l'ajout du substrat: 4- 
HPA 1 mM. La reaction est suivie a 340 nm ou a 292 nm pendant 2 a 10 min. En effet, 
la consommation du NADH,Ff se traduit par une diminution de l'absorbance a 340 nm 

30 tandis que la production d'homogentisate se traduit par une augmentation de 
l'absorbance a 292 nm. Le test spectrophotometrique est tres rapide, il est utilise en 
routine pour suivre l'elution des proteines lors des etapes de purification. 
II. 1.2.1- Test d'activite HPLC 
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L' analyse des reactions enzymatiques par HPLC permet de confirmer la 
production d'HGA (temps de retention, spectre UV). Le test enzymatique est realise 
dans les memes conditions que ci-dessus. Cependant la reaction est arretee par ajout 
dun tiers de volume d'acide perchlorique 20%. Les reactions sont alors analysees par 
5 HPLC en elution isocratique avec 90% de phase A et 10 % de phase B ou 92% de phase 
A et 8% de phase B. La phase A est de l'eau milli Q contenant 0,1% d'acide 
trifluoroacetique (TFA) et la phase B correspond a de racetonitrile. Dans 1' elution en 
isocratique 90% - 10%, l'HGA est elue en 1,2 min alors qu'en systeme isocratique 92% 
- 8% il est elue en 1,4 min. L'elution est enregistree generalement a 230 nm. Van den 

10 Tweel et al. (1986) ont utilise le 2,2'-bipyridyl (inhibiteur de proteine a fer non 
hemique) pour inhiber l'homogentisate dioxygenase et ainsi permettre 1' accumulation de 
l'HGA. Pour cette raison, nous ajoutons dans certains milieu reactionnel 2 mM de 2,2- 
bipyridyl. Dans ces conditions chromatographiques, il est possible didentifier le 4-HPA 
et l'HGA. La chaine HPLC est constitute d'une HPLC Alliance 2690 (Waters) et d'un 

1 5 detecteur a barette diode 996(Waters) . 

IL 1 .2.3- Purification de la proteine HPAH 
Pseudomonas acidovorans est cultive 48 heures sur milieu M63 contenant du 4- 
HPA comme seule source de carbone, a 29°C, 220 rpm. Les bacteries sont centrifugees 

20 a 3 000 g pendant 15 min a 6°C (Beckmann J2/21 M/E centrifuge). Le culot bacterien 
est repris dans le tampon de sonication (KPi 0,1 M pH 7,2; MgS0 4 ImM; DTT ImM; 
benzamidine hydrochloride 1 mM; acide caproi'que 5 mM). La benzamidine 
hydrochloride et 1' acide caproi'que sont des inhibiteurs de proteases. La sonication est 
realisee pendant 9 minutes en sonicant toutes les quarante secondes pendant vingt 

25 secondes a la puissance 5 (Vibra Cell, Sonic Materials INC., Connecticut, USA). Durant 
la sonication, l'echantillon est maintenu a la temperature de la glace fondante. L'extrait 
sonique est centrifuge a 15 000 g pendant 15 min a 4°C. Le surnageant recupere est 
precipite avec 1 % de sulfate de streptomycine. Le precipite est elimine par 
centrifugation a 15 000 g pendant 15 min a 4°C. Le surnageant est dessale sur colonne 

30 PD10 (Pharmacia) puis charge sur colonne DEAL7EMD 650 S equilibree en tampon A 
(KPi 20 mM pH 7,2, glycerol 10 %, MgS0 4 1 mM, DTT 1 mM). L'elution se fait en 
utilisant un tampon B (tampon A; KC1 1 M; 100 uM FAD). L'activite 4-HPA 1- 
hydroxylase est eluee pour une concentration en KC1 voisine de 150 mM. Les fractions 
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actives, concentrees sur membrane UVIKON 10 kDa puis dessalees sur colonne PD10, 
sont alors deposees sur une colonne d'affinite Red (Red 120 Agarose type 3000 CL, 
SIGMA Ref R-0503) equilibree en tampon A (ci dessus). L'elution est realisee en deux 
etapes. La premiere est un lavage de la colonne Red en utilisant le tampon A enrichi 
5 avec du FAD 50 uM final. La deuxieme permet l'elution de la proteine; pour cela le 
tampon A est enrichi en FAD (3 mM) et en NADH,H + (10 mM). Les fractions, 
contenant la proteine d'interet, sont rassemblees, concentrees et congelees a-80°C. 

11.1.3- Microsequencage proteique de Pextremite N-terminale et de peptides 
internes 

1 0 Le meme protocole que celui decrit dans le cas de l'HPP oxydase a ete utilise pour 

realiser le sequencage de la proteine purifiee. Cependant, pour produire les peptides 
internes, la proteine a ete digeree a la trypsine au lieu de l'endopeptidase Lys-C. La 
trypsine coupe apres les arginines et les lysines. La digestion par la trypsine conduit 
generalement a l'obtention de fragments plus petits que ceux obtenus lors d'une 

15 digestion par l'endopeptidase Lys-C. Afin de pouvoir sequencer avec precision les 
peptides recuperet, il est parfois necessaire de repurifier par HPLC les peptides 
r^cuperes. 

11.1.4- Identification d'une partie du gene codant PHPAH par PCR 
degeneree 

20 Pour la synthese des amorces degenerees on utilise le code de degenerescence 

presente en page 43. La PCR est realisee dans un volume final de 50 oL, dans des tubes 
de 200 uL. La solution reactionnelle contient le tampon Perkin Elmer, 250 uM dNTP, 
50 ng d'ADN genomique de P. acidovorans, 2 unites enzymatiques d'AmpliTaq (Perkin 
Elmer). La reaction est realisee en utilisant un thermocycleur "Hybaid Touchdown": 3 

25 min a 94°C, puis quarante cinq cycles : 30 sec a 94°C, 1 min a 50°C, 1 min 30 sec a 
72°C, suivi d'une elongation finale de 5 min a 72°C avant de revenir a 4°C. La PCR est 
evaluee apres depot de 10 uL sur gel 1% agarose. Dans ces conditions une bande de 
536 pb est identifiee. 

11.1.5- Criblage de la banque cosmidique de P. acidovorans 

30 Etalement de la banque cosmidique sur milieu LBT 15 et croissance pendant 1 6 hOO 

a 37°C. Les boites sont alors transferees a 4°C. Au bout d'une heure, les colonies sont 
transferees sur membranes Hybond N (Amersham) selon la methode de Grunstein & 
Hogness (1975). Les membranes sont hybridees en utilisant le fragment PCR de 536 pb 
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precedernment identifie et purifie. La detection est realisee en 32 P. La sonde est marquee 
en utilisant le kit « DNA Ready to Go » (Pharmacia). La pre-hybridation, l'hybridation 
et les lavages sont realises en ampoules. Les membranes sont pre-hydridees dans une 
solution composee de SSC 5x, Denhardt 6%, SDS 0,5% pendant 4 heures a 68°C. 
5 L'hybridation est realisee pendant 16 heures a 68°C. Les lavages sont effectues a 65°C 
en SSC 2x, SDS 0,1%. Les membranes sont revelees en exposant des films Kodak ou 
Amersham. 

II.1.6- Milieux de croissance de P. putida 

Pseudomonas putida est cultive sur milieu riche de Luria-Bertani (LB) ou 2YT 

10 contenant 100 ug-mL" 1 de rifampicine. En fonction des besoins d'autres antibiotiques 
sont ajoutes (exemple : tetracycline a 15 jj-g.mL" 1 ). Le milieu minimum M63 contenant 
1,5 g.L" 1 de 4-HPA comme seule source de carbone est utilise pour tester la 
complementation fonctionnelle. Dans ce cas les antibiotiques sont omis. Toutes les 
cultures sont realisees a 29°C. 

1 5 11.1,7- Transformation de P.putida par electroporation 

1 litre de milieu LB Rifampicine (100 ug.mL" 1 ) est inocule avec une culture de 
P. putida mise en croissance a 29°C pendant environ 16 heures en agitation a 180 rpm. 
Lorsque la DO 600nm est voisine de 1,2, les cellules sont collectees par centrifugation 
pendant 15 min a 3 000 g, 4°C. Le milieu de culture est elimine et les cellules sont 

20 reprises avec 400 mL de glycerol 10% a 4°C. Les cellules sont centrifugees une 
nouvelle fois a 3000 g, 20 min, 4°C. Deux nouvelles etapes de lavage sont effectuees 
avec respectivement 200 puis 100 mL de glycerol 10%, 4°C. Enfin, les bacteries sont 
reprises par 3 a 10 mL de glycerol 10% puis reparties en aliquotes de 100 uL 
immediatement congelees dans l'azote liquide. Les bacteries ainsi preparees se 

25 conservent au moins six mois a - 80°C. Lors de la preparation, on observe une perte de 
bacteries due a la lyse. L'ADN cosmidique (Tet*) est introduit par electroporation dans 
les P. putida (Rif*). L'electroporation (Bio-Rad Gene Pulser™) de 80 ng d'ADN 
cosmidique dans 100 uL P. putida electrocompetentes se fait en cuvette 
d'electroporation de 2 mm sous une tension de 0,9 volt avec une resistance de 

30 l'electroporateur de 200 Q. Dans ces conditions, la constante de temps x Dest d'environ 
4,5 msec. Apres le choc electrique, les cellules sont reprises avec 900 uL de LB et mise 
en culture pendant lh30 a 29°C, 180 rpm. Les P. putida transformees sont selectionnees 
sur milieu gelose LB Rif 100 Tet 15 . 
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11.1.8- Modification du vecteur large spectre d'hote pBBRlMCS-Gm R 

Nous avons utilise les vecteurs a large spectre d'hote a Gram negatif de la serie 
des pBBRlMCS (Kovach et al, 1994, 1995). Ces plasmides, qui possedent une origine 
de replication de Bordetella bronchiseptica, se repliquent a environ 20-30 copies par 
5 cellule chez E. coli. lis contiennent deux sites Not I. Afin de faciliter les clonages 
ulterieurs on supprime le site Not I present hors du multi-site de clonage (MCS) sur le 
plasmide pBBRlMCS-Gm R . Pour cela, le plasmide est coupe" par Sfi I (50°C) puis traite 
a la T4 DNA polymerase afin d'obtenir des bouts francs. Le plasmide est religue sur lui 
meme (T4 DNA Ligase - New England Biolabs). Apres ligation (16 heures, 16°C), une 
10 digestion par Sfi I est realisee afin d'eliminer les eventuels plasmides " sauvages ", puis 
on electropore E. coli DH5a. L'ADN plasmidique est isole des clones selectionnes sur 
milieu LB Gm 20 . Les ADN plasmidiques sont caracterises par deux digestions: Not I et 
Not HBgl II. Un clone est retenu: pBBRlMCS-Gm-Not-U. 

11.1.9- Sous-clonage du Ccos8 dans pBBRlMCS-Gm-U 

15 Le cosmide Ccos8 est restreint par Not I puis depose sur gel agarose. Apres 

migration, 6 bandes d'ADN sont visualisees : 1,7-3-4-5-8-10 kbp. Les bandes 
sont purifiees par Quiaex II. Par ailleurs, pBBRlMCS-Gm-Not-U est restreint par Not I, 
dephosphoryle en utilisant la phosphatase alcaline de crevette (S.A.P.; shrimp alkaline 
phosphatase). Les differentes bandes sont alors liees (T4 DNA ligase, 16 heures, 16°C) 

20 dans le vecteur en utilisant des rapports " insert/vecteur " variables. Les produits de 
ligation sont transformes dans E. coli DH5a. 

11.1.10- Conjugaison tri-parentale entre E. coli et P. putida 

Afin de transferer les differents sous-clones de Ccos8 (Gm R ) de E. coli DH5a vers 
P. putida (Rif 1 ), on opere par conjugaison tri-parentale sur filtre en utilisant le protocole 
25 decrit par De Lorenzo et al. (1990). Les bacteries recuperees sont etalees sur LB 
Rif^^Gm 20 et sur M63 ayant le 4-HPA comme seule source de carbone. 

11.1.11- Elimination du plasmide p5kbC 

Pour eliminer rapidement le plasmide p5kbC de P. putida, nous utilisons la 
strategic des origines de replication incompatibles et nous forcons la perte du p5kbC a 
30 l'aide d'antibiotiques. On transforme P. putida (Rif 100 ) complemente par le plamide 
p5kbC (Gm R ) avec pBBRlMCS Kn R . Les clones obtenus (Rif 100 Gm R Kn R ) sont verifies 
pour leur activite de complementation. Les clones sont alors cultives sur deux milieux : 
LB Rif 00 Kn 150 Gm 20 et LB Rif 400 Kn 150 . Ce faisant nous maintenons la pression de 
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selection pour p5kbC et pBBRlMCS Kn R ou bien seulement pour pBBRlMCS Kn R . 
Les croissances sont realisees a 29°C. Le repiquage est realise tous les trois jours. Au 
huitieme repiquage, les colonies sont repiquees sur 4 milieux differents (M63, M63 + 4- 
HPA, LB Rif 100 Kn 150 Gm 20 et LB Rif 100 Kn 1S0 ) quelle que soit la boite d'origine. L'etat 
5 de croissance est alors releve au bout de 2 et 7 jours. 

II.1.12- Identification des proteines participant a l'activite enzymatique. 
II. 1.1 2.1- Preparation d'extraits bruts de P. putida 
Deux clones P. putida sont cultives sur LB Gm 20 pendant 24 heures. Le premier 
comporte le plasmide pBBRlMCS-Gm-Not-U tandis que le second contient le plasmide 
10 de complementation p5kbC. Apres sonication dans un tampon (KPi 0.1 M; MgS04 
ImM; DTT ImM; benzamidine hydrochloride 1 mM; acide capro'ique 5 mM), puis 
centrirugation a 20 000 g pendant 10 min a 4°C, le surnageant est teste pour son activite 
4-HPA 1 -hydroxylase en utilisant les deux methodes de mesure de l'activite 
enzymatique. Les extraits bruts sont, en outre, analyses par SDS-PAGE a 10%. 
15 II. 1 . 1 2.2- Transfert sur membrane, Sequencage N-terminal 

Le sequencage est realise comme en exemple I. 

II. 1.12.3- Gel Filtration S75 
L'eluat (5 mL) est concentree d'un facteur 10 en utilisant un Macrosep™ 10 K 
(Pall Filtron) pendant deux heures a 4°C. Les 500 uL concentres sont injectes sur une 
20 colonne de gel filtration Superdex™ 75 prep grade (HiLoad 16/60, Pharmacia) 
prealablement equilibree avec 700 mL de tampon (KPi 0,02 M pH 7,2; glycerol 10% ; 
MgS0 4 1 mM ; DTT 1 mM ; 4°C) a un debit de 0,7 mL.min La chromatographie est 
realisee a 4°C avec un debit de 1 mL-min" 1 . Les fractions sont collectees toutes les 
minutes et conservees a 4°C. 
25 n.1.12.4- Construction de pBBRlMCS FT12A1 

Pour construire le plasmide pBBRlMCS FT12A1 on utilise une strategic de 
clonage en deux etapes. Le plasmide p5kbC est digere par Nsi I et Not I. L'insert 
obtenu, codant les genes 1, hpaH et 3, est alors clone dans pBBRlMCS-Gm-Not-U 
digere Pst I et Not I. Le clone resultant, denomme pBBRlMCS FT12, est restreint par 
30 Hind III et Asc I, puis rendu bout-francs et enfm religue. Ce faisant, les genes 1 et 3 sont 
detruits et le gene hpdR se trouve sous la dependance du promoteur lac du vecteur 
originel. Nous obtenons ainsi le plasmide pBBRlMCS FT12A1 (Figure 6). 
II. 1.12.5- Construction de pLllac2 
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Le laboratoire possede un plasmide denomme "Clone L". Cette construction 
correspond au clonage du promoteur et du gene de l'HPPD de P. fluorescens dans le 
vecteur pBBRlMCS-Kn R . Le promoteur du gene HPPD est fonctionnel chez P. putida 
et chez E. coli. Le plasmide "Clone L" est digere par Bam HI et Hin dill ce qui permet 
5 de recuperer l'insert contenant le promoteur et le gene HPPD de P. fluorescens. Cet 
insert est alors ligue dans le vecteur pBBRlMCS-Gm R digere par Bam HI et Hin dill. 
Le clone resultant est denomme pBBRG-L-HPPD. Le plasmide obtenu, digere par Nco I 
pour eliminer le gene codant l'HPPD, est ligue avec le gene hpaC amplifie par PCR et 
digere par Aft III. La construction obtenue est appelee pBBRG-L-ORFl. Pour 

10 ramplification du gene hpaC par PCR, on utilise des amorces qui permettent 
d'introduire un site Afl III en debut et en fin de gene (le site Afl III est compatible avec 
le site Not I). Les amorces utilisees sont : en 5' du gene : GCAGGATGCA 
CATGTCCACC AAGAC et en 3' du gene : CGGACGCCGA CATGTATCAG CCTTC. La 
PCR est realisee en utilisant 1 unite de KlenTaq polymerase (Sigma), 250 uM de dNTP, 

15 200 nM de chaque amorce et 50 ng du plasmide p5kbC. Le programme de PCR est 
deTmi comme suit sur Perkin Elmer 9600 : 3 min a 95°C ; puis 20 cycles : 94°C pendant 
1 min, 60°C pendant 30 sec, 68°C pendant 3 min ; enfin une derniere etape de 10 min a 
68°C est realisee. Le plasmide pBBRlMCS FT12A1 precedemment obtenu est restraint 
par Ssp I et Not I. Le site Not I est rendu franc par traitement avec la Pfu. Le fragment 

20 recupere (2468 pb), contenant le gene hpaR sous la dependance du promoteur lac, est 
ligue dans pBBRG-L-ORFl digere par Ssp I. Le clone presentant les genes hpaC et 
hpdH en antisens est retenu, il est nomme pLllac2. Tous ces clonages sont realisee dans 
E. coli DH5a. 
II.2- Resultats 

25 Differentes approches sont envisageables pour identifier le gene codant l'activite 

4-HPA 1 -hydroxylase de P. acidovorans. Nous decidons dans un premier temps 
d'utiliser une approche par coloration phenotypique. Cette approche parait simple et 
rapide. En effet, nous possedons au laboratoire un outil de criblage phenotypique pour 
detecter la production d'HGA. Or 1' enzyme que nous recherchons convertit le 4-HPA en 

30 HGA. 

II.2.1- Approche par coloration phenotypique 

Nous avons observe au laboratoire qu'E. coli K12 ne peut pas croitre en utilisant 
la tyrosine ou le 4-HPA comme seule source de carbone. Nous savons d'autre part qu'-E. 
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coli K12 possede l'activite tyrosine aminotransferase qui permet la synthese de tyrosine 
a partir d'HPP. Cette activite enzymatique est reversible, la cellule peut done produire 
de l'HPP a partir de la tyrosine. Si le milieu riche de culture est enrichi en tyrosine (1 
g.L" 1 ), la tyrosine est importe dans les bacteries qui l'accumulent puis la transforme en 
5 HPP, selon la constante d'equilibre de la reaction de conversion entre HPP et tyrosine. 
Au laboratoire, nous avons deja observe que si nous introduisons l'HPPD de P. 
fluorescens dans E. coli K12 alors l'HPP produit lors de la desarnination de la tyrosine, 
est transforme en homogentisate (HGA). La reaction catalysee par l'HPPD etant 
irreversible, l'HGA s'accumule dans la cellule ou il s'oxyde puis polymerise 

10 spontanement pour former un pigment ochronotique presentant une coloration brune. 
Nous avons done la un moyen de detecter la production d'HGA. La 4-HPA 1- 
hydroxylase recherchee convertit le 4-HPA en HGA. On etale done les E. coli HB101 
contenant la banque genomique de Pseudomonas acidovorans sur milieu gelose 2YT 
enrichi en 4-HPA. Apres deux jours, deux colonies brunissent : elles produisent done de 

15 l'homogentisate. Cependant, les activites enzymatiques realisees sur les extraits bruts de 
ces deux clones revelent une activite enzymatique de type HPPD alors que l'activite 4- 
HPA 1 -hydroxylase recherchee est discrete, voire inexistante. A priori cette approche a 
permis de selectionner les clones dont le cosmide contient le gene codant une HPPD de 
P. acidovorans et non pas la 4-HPA 1 -hydroxylase. Lors de l'etude preliminaire in vitro 

20 sur les extraits bruts de P. acidovorans, l'activite HPPD n'a pas ete identifiee. On peut 
supposer que l'activite HPPD de P. acidovorans s'exprimerait lorsque la bacterie est 
cultivee sur milieu riche tandis que l'activite 4-HPA 1 -hydroxylase s'exprimerait 
lorsque le 4-HPA est la seule source de carbone. Cette approche ne permettant pas 
1'identification de la 4-HPA 1 -hydroxylase nous decidons de purifier l'enzyme. Une fois 

25 la proteine identifiee, il sera possible de remonter au gene correspondant. 
II.2.2- Purification de la 4-HPA 1-hydroxylase 
Pour suivre la purification de la proteine, nous utilisons le dosage de son activite 
NADH,H*" oxydase dependante du 4-HPA. Nous purifions ainsi la proteine a quasi 
homogeneite en appliquant le protocole de purification decrit precedemment. Le facteur 

30 d'enrichissement de l'activite specifique NADH,H + oxydase est generalement compris 
entre 50 et 100 selon les preparations. Sur SDS-PAGE, la proteine presente un poids 
moleculaire apparent de 60 kDa. En fait, nous observons que l'activite NADH,!! 4 " 
oxydase et la production d'HGA sont bien visibles en sortie de DEAE/EMD 650S. Par 
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contre en sortie de colonne d'afBnite, la production d'HGA est tres difficilement 
decelable; l'activite NADH,H + oxydase reste cependant dependante de l'ajout du 4-HPA 
dans le milieu reactionnel. Si nous partons de l'hypothese que 1'enzyme est 
monomerique, la perte de l'activite catalytique permettant la production d'HGA peut 

5 s'expliquer en supposant qu'une partie de la proteine a ete endommagee (ex : perte d'un 
cofacteur fortement lie) lors de son passage sur la colonne Red. Le site catalysant 
l'oxydation du NADH,lT ne serait pas touche. On peut aussi supposer que 1'enzyme 
recherchee est un heterodimere. La perte de l'activite catalytique s'expliquerait alors par 
la perte du monomere responsable de la production d'HGA. Dans la litterature de 

10 nombreuses monooxygenases heterodimeriques a flavine ont ete identifiees, ayant 
toutes un substrat aromatique, dans des especes bacteriennes variees (Adachi et al, 
1964; Arunachalam et al, 1992, 1994; Prieto et al, 1993; Prieto & Garcia, 1994; 
Arunachalam & Massey, 1994; Takizawa et al, 1995; Xun, 1996 ; Xun & Sandvik, 
2000). Cependant, il existe deux hypotheses pour expliquer le fonctionnement de ces 

15 enzymes heterodimeriques: 

(1) Arunachalam et al (1992, 1994) proposent que la 4-hydroxyphenylacetate 3- 
hydroxylase de P. putida soit constitute d'une flavoproteine homodim6rique de 65 kDa 
ainsi que d'une proteine de couplage de 38,5 kDa. La flavoproteine seule est capable 
d'oxyder le NADH,H + independamment de la presence de 4-HPA. Cette oxydation du 

20 NADH,^ permet de renouveler le "pool" de NAD + , mais produit de l'H 2 0 2 dans des 
proportions stoechiometriques. Si la proteine de couplage est ajoutee, le complexe 
proteique devient capable d'hydroxyler le 4-HPA en acide 3,4-dihydroxyphenylacetique. 
Ainsi, l'oxydation du NADH,^ n'est pas gaspillee et permet la synthese d'un 
metabolite. La proteine de couplage seule n'a pas d'activite enzymatique. 

25 (2) Prieto et al (1993, 1994) et Xun & Sandvik (2000) suggerent que la 4-HPA 3- 
hydroxylase de E. coli W (ATCC 11105) soit consideree comme un nouveau membre 
des monooxygenases a flavine a deux composantes mobiles (TC-FDM). Les deux 
composantes seraient d'une part la 4-hydroxyphenylacetate 3 -hydroxylase, une enzyme 
monomerique de 59 kDa codee par le gene HpaB, et d' autre part une flavine:NADH 

30 oxydoreductase monomerique de 19 kDa, codee par le gene HpaC. Dans ce cas, le FAD 
est reduit au depend du NADH,H + par la flavine:NADH,H + oxydoreductase. Le FADH 2 
est alors utilise par l'oxygenase pour permettre l'oxydation du substrat en utilisant 
l'oxygene moleculaire. 
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L'enzyme que nous avons purifiee oxyde fortement le NADHjEf mais produit tres 
peu d'homogentisate. En outre l'oxydation du NADH,H + est dependante de Taj out de 4- 
HPA. Ceci suggere que nous possedons une enzyme du type de celle decrite par Prieto 
et al. Nous considerons done que l'enzyme purifiee est la 4-HPA 1 -hydroxylase 
5 (HP AH) recherchee. II est possible, que par la suite, il soit necessaire d'identifier une 
proteine de couplage pour optimiser l'activite enzymatique. L'approche biochimique 
peut done se poursuivre avec la proteine purifiee. 

11.2.3- Obtention des peptides internes et de la sequence N-terminale. 

La proteine purifiee est envoyee a l'Institut Pasteur pour etre micro-sequencee. 

10 C'est ainsi que Ton obtient la sequence N-terminale SHPAISLQAL RGSGADIQSI 
HIPYER et six peptides internes nommes respectivement peptides N° 11C, 12D, 20A, 
22B, 23, 24 en fonction de leur ordre de sortie de colonne: ATDFITPK, 
LGVGQPMVDK, VVFAGDSAHG VSPFX, VTALEPQAEG AL, IDFQLGWDAD 
PEEEK, LSVPATLHGS ALNTPDTDTF. Sur la sequence N-terminale, on ne retrouve 

15 pas l'acide amine (methionine ou valine) correspondant normalement au codon 
d'initiation du gene (ATG ou GTG). Les analyses d'homologies dans les bases 
proteiques en utilisant ralgorithme BLASTP ne permettent pas d'identifier de proteines 
homologues. Sur la base des sequences proteiques obtenues, nous faisons synthetiser les 
oligonucleotides degeneres correspondants. Ceux-ci sont utilises dans des reactions de 

20 PCR afin d'identifier une partie du gene codant la proteine HPAH purifiee et 
partiellement sequencee. 

11.2.4- Obtention du fragment PCR 

L'amplification par PCR d'une portion (536 pb) du gene codant la 4-HPA 1- 
hydroxylase est obtenue en utilisant les amorces degenerees Hy4R: TCYTCNGGRT 

25 CNGCRTCCCA et Hy5F: GGNGTNGGNC ARCCNATGGT qui codent respectivement les 
peptides 23 et 12D. Ces amorces ont une temperature d'hybridation de 55,4°C et 
presentent une degenerescence de 128 et 512 respectivement. La sequence amplifiee est 
clonee dans le vecteur pGEMT-easy puis elle est sequencee. L'analyse de la sequence 
obtenue permet de retrouver, outre les sequences codant les peptides Hy4R et Hy5F, la 

30 sequence nucleique codant le peptide interne 22B. Ce dernier element permet de 
confirmer que nous avons bien amplifie une partie du gene codant la proteine HPAH 
purifiee. A ce stade, les recherches d'homologies dans les bases proteiques, en utilisant 
ralgorithme BLASTX, font ressortir quelques faibles homologies avec des 



WO 02/36787 5Q PCT/FR01/03364 

hydroxylases, des oxydases et des monooxygenases. En utilisant la sequence de 536 pb 
amplifiee par PCR, nous allons pouvoir cribler une banque cosmidique de P. 
acidovorans afin de rechercher le cosmide contenant le gene complet. 

11.2.5- Criblage de la banque cosmidique de P. acidovorans 

5 Le criblage de la banque cosmidique, en utilisant comme sonde la sequence 

obtenue ci-dessus, a permis d'identifier 4 groupes de cosmides considered comme 
differents sur la base de leurs profils de restriction et d'hybridation apres transfert par la 
technique de Southern. Les cosmides N° 1, 2, 6 forment le premier groupe, les cosmides 
N° 3, 7, 9 forment le second tandis que les cosmides N°5 et 8 forment le troisieme . Le 

10 dernier groupe est represente par le cosmide N°4. Les resultats d'hydridation suggerent 
en outre que le gene hpaU recherche est present en un seul exemplaire dans le genome 
de Pseudomonas acidovorans. Nous avons identifie des cosmides comportant au moins 
une partie du gene codant la proteine HPAH purifiee. Entre temps, nous avons observe 
que P. putida etait incapable de croitre sur 4-HPA mais pouvait croitre en utilisant 

15 l'HGA comme seule source de carbone. Nous possedons done la un excellent crible 
pour la complementation fonctionnelle ; nous pourrons ainsi definir lequel de ces 
cosmides comporte le gene fonctionnel codant l'activite 4-HPA 1 -hydroxylase. 

11.2.6- Complementation fonctionnelle avec les cosmides 

Les neuf cosmides precedemrnent identifies sont introduits dans P. putida par 
20 electroporation. Les clones obtenus sont alors repiques sur milieu M63 contenant du 4- 
HPA comme seule source de carbone. Au bout de 7-8 jours seules les bactefies 
possedant le cosmide N°8 ont reussi a croitre. C'est a dire que seul le cosmide N°8 
contient toute rinformation exprimable permettant la conversion du 4-HPA en HGA 
utilisable par P. putida. Le cosmide est alors denomme Ccos8. La transformation avec 
25 l'ensemble des cosmides est repetee. C'est toujours le cosmide 8 qui permet la 
complementation apres un certain delai (6-10 jours). Afin de pouvoir avancer dans notre 
approche de determination du fragment d'ADN minimum exprimant l'activite 4-HPA 1- 
hydroxylase, il nous faut sous-cloner le Ccos8. La selection du sous-clone interessant se 
fera en utilisant le crible de la complementation fonctionnelle. 
30 II.2.7- Sous clonage par complementation fonctionnelle 

La digestion par Not I du cosmide permet d'obtenir 6 fragments d'ADN de taille 
comprise entre 1,7 et 10 kb. Ces fragments sont clones dans pBBRlMCS-Gm-Not-U. 
Cinq sous-clones de Ccos8 sont obtenus. L'analyse par restriction montre que les 
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fragments de 4 et 10 kb ne sont pas sous clones. En revanche, nous observons que la 
bande de 5 kb observee initialement etait en fait une bande double de 5,1 et 5,2 kb. Ces 
clones sont passes, par conjugaison tri-parentale, de E. coli a P. putida. Au bout de 5 
jours, seul P. putida contenant le sous-clone correspondant a la bande de 5,2 kb du 
5 cosmide Ccos8 a pousse sur M63 contenant le 4-HPA comme seule source de carbone. 
Nous venons done d'identifier le fragment minimal comportant l'activite 4-HPA 1- 
hydroxylase. Les clones correspondants a la bande de 5,2 kb sont nommes 5kbC. Pour 
confirmer le resultat de la complementation fonctionnelle, nous provoquons 
l'elimination du plasmide p5kbC en utilisant la strategie des origines de replication 

10 incompatibles et en forcant 1' elimination du plasmide p5kbC par la pression de selection 
des antibiotiques utilises. Nous observons que P. putida perd la capacite a croitre sur 4- 
HPA comme seule source de carbone lorsqu'il a perdu le plasmide p5kbC. Nous en 
concluons que l'activite enzymatique 4-HPA 1 -hydroxylase est bien portee par le 
plasmide p5kbC. Nous pouvons done faire sequencer 1'insert de 5,2 kb, ce qui devrait 

1 5 nous permettre d'identifier le gene hpaH fonctionnel. 
II.2.8- Analyse de la sequence de 5,2 kb 

L 'insert de 5,2 kb du plasmide p5kbC est sequence. Une recherche d'homologie 
nucleique (BLASTN) permet d'identifier ainsi trois parties dans 1'insert. La premiere 
partie comprise entre les bases N° 1 et 1465 est parfaitement homologue d'une partie du 

20 plasmide Birmingham IncP-alpha. II s'agit done vraisemblablement d'une sequence 
issue de pLAFR5. Une seconde partie nucleique comprise entre les bases N° 1466 et 
1695 presente une homologie parfaite avec une partie du plasmide de clonage 
M13mp8/pUC8. Cette sequence fait done encore partie du pLAFR-5 ; en effet le multi- 
site de clonage de pLAFR-5 provient de pUC8 (Keen et ah, 1988). Ainsi, les sites Eco 

25 RI et Sma I (Figure 7) en position respective 1689 et 1695 sont vraisemblablement les 
sites de clonage du pLAFR-5. La troisieme partie, comprise entre les bases 1696 et 5264 
(soit 3568 pb) ne presente pas d'homologies fortes. Cette partie d'ADN provient du 
genome de P. acidovorans. Lorsque la sequence de 5,2 kb est analysee en utilisant 
ragorithme BLASTX, on identifie des proteines probables (Figure 7). Ainsi la proteine 

30 codee par le gene 1 presente de faibles homologies avec a des beta-lactamases, des 
dehydrases et des cyclases. La proteine purifiee est codee par le gene 2 puisque l'on 
retrouve les sequences codant les peptides internes precedemment obtenus ; e'est done 
vraisemblablement la 4-HPA 1 -hydroxylase. Les alignements proteiques montrent que 
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cette proteine presente quelques homologies avec des oxygenases et des hydroxylases. 
La proteine potentiellement codee par le gene 3 ne presente pas d'homologies avec les 
bases de donnees. Enfin le gene 4 code vraisemblablement un regulateur d'operon. 

Faisons maintenant a une analyse plus fine du gene hpdB. D'apres la sequence 
5 proteique N-terminale obtenue, le codon initiation ATG de la proteine 4-HPA 1- 
hydroxylase se trouve en fait 78 pb en aval d'un codon initiateur GTG en phase avec 
l'ATG. La sequence Shine-Dalgarno AGGA, permettant la fixation des ribosomes, est 
retrouvee en amont de TATG initiateur mais pas en amont du codon initiateur GTG ; ce 
qui confirme que la region codante commence au codon initiateur ATG. La portion 

10 comprise entre les codons GTG et ATG ne correspond done vraisemblablement pas a 
une preproteine. Ainsi defini, le gene hpaR est long de 1737 pb et se termine par le 
codon stop TGA. Le gene est constitue a 70,9 % de bases GC. 

Maintenant que nous avons defini avec precision les limites du gene hpaR, 
analysons le produit de sa traduction : la proteine HP AH 

1 5 II.2.9- Analyse de la proteine HPAH 

La sequence hpaR est traduite en utilisant le syteme universel des codons. Nous 
obtenons ainsi une proteine de 563 acides amines, ce qui represente un poids 
moleculaire de 62,2 kDa. Les recherches d'homologies proteique (BLASTP) montre que 
l'HPAH presente environ 15 a 25 % d'identite essentiellement avec des proteines 

20 d'organismes a Gram positif codant pour des activites enzymatiques apparemment tres 
differentes de celle recherchee. Ainsi on retrouve une oxygenase de Streptomyces 
argillaceus, la 3-(3-hydroxy-phenyl)propionate hydroxylase (EC 1.14.13.-) d'E. coli, la 
2.4-dihydroxybenzoate monooxygenase de Sphingomonas sp., Fenzyme catalysant la 6- 
hydroxylation de la tetracycline chez Streptomyces aureofaciens, une oxygenase 

25 potentielle de Streptomyces fradiae. En fait, l'HPAH presente des homologies avec les 
proteines de la famille des phenol monooxygenases (pheA) et celles de la famille des 
2,4-dichlorophenol hydroxylase (tfdB). L'alignement correspondant aux proteines 
precitees est realise en utilisant l'algoritme ClustalW (Figure 8). II permet de mettre en 
evidence des boites tres conservees. On relevera entre autre trois motifs d'interaction 

30 avec le FAD. Le premier (GXGXXG) correspond au motif structurel (3-a-p qui permet 
l'interaction de la partie ADP du FAD avec la proteine. Le deuxieme motif (A/C)DG est 
implique dans la fixation du FAD tandis que le troisieme motif 
G (R) VXX (A) GD (A) XH permet l'interaction avec la partie flavine du FAD. Bien que 
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l'enzyme utilise du NADH, H* le site de fixation correspondant (GDH) n'est pas 
identifie. Cette absence de site de fixation au NADH,H + est une caracteristique souvent 
observee chez d'autres monooxygenases a FAD. Enfin, on observe un motif 
(DXXXLXWKLX XXXXXXXXXX LLXXYXXER) que l'on retrouve aussi chez d'autres 
5 hydroxylases (Ferrandez et al, 1997), mais dont la signification n'est pas eclaircie. Bien 
que la 3-(3-hydroxyphenyl)-propionate hydroxylase d'E. coli catalyse une reaction 
d'hydroxylation sur un substrat structurellement proche du 4-HPA, les informations 
acquises par ces analyses bioinformatiques ne permettent pas de s'assurer que nous 
avons bien identifie la 4-HPA 1 -hydroxylase. La seule maniere de le faire, c'est 

10 d'exprimer le gene hpdR et d'etudier son activite enzymatique. 

II.2.10- Identite des proteines impliquees dans l'activite 4-HPA 1-hydroxylase 
II.2.10.1- Expression du gene hpdR codant la 4-HPA 1 -Hydroxylase 
Afm de confirmer que le gene hpdR code l'activite 4-HPA 1-hydroxylase, il est 
necessaire d'exprimer le gene. Pour ce faire, une strategie de clonage en deux etape est 

15 utilisee permettant d'eliminer les genes N° 1 et 3 et de placer le gene hpdR sous la 
dependance du promoteur lac du vecteur originel pBBRlMCS-Gm-Not-U. Le plasmide 
obtenu est denomme pBBRlMCS FT12A1. Un extrait brut est realise a partir d'une 
culture sur milieu riche de P. putida transformee avec ce plasmide. La recherche 
d' activite par spectrophotometrie (a 340 et 292 nm) montre que le clone possede certes 

20 l'activite NADH,H + oxydase induite par l'ajout de 4-HPA, mais ne possede pas la 
capacite de synthese de l'homogentisate a partir du 4-HPA. En revanche on observe 
1' apparition d'une molecule Z ayant un temps de retention tres proche (tr =1,2 minutes 
versus 1,4 minutes) mais un spectre UV tres different de celui de l'HGA. Nous posons 
l'hypothese que l'HPAH oxyde le NADH,H + pour reduire son cofacteur FAD. La 

25 reoxydation du FAD se fait au detriment du 4-HPA puisque c'est l'ajout du 4-HPA qui 
initie la reaction. Le 4-HPA est done convertit en metabolite Z. Le spectre UV de ce 
metabolite suggere que le cycle n'est plus aromatique mais peut etre cependant insature. 
Nous presentons en figure 2 une hypothese structurale pour le metabolite Z. Cette 
experience montre que le promoteur lac est fonctionnel chez P. putida en absence 

30 d'inducteur IPTG, ce qui suggere que le represseur lad est naturellement absent chez P. 
putida. Nous demontrons en outre que la proteine initialement purifiee (HP AH) est 
reellement une NADH,H + oxydase dependante du 4-HPA qui convertit le 4-HPA en un 
metabolite Z. La HP AH ne produit pas d'HGA. II est done necessaire d'identifier la ou 
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les proteines partenaires de cette NADHjH 1 " oxydase dependante du 4-HPA et dont 
l'ajout permet de restorer l'activite 4-HPA 1 -hydroxylase. 

II.2.10.2- Identification de la proteine HP AC par gel filtration 
Nous avons vu que l'activite 4-HPA 1 -hydroxylase disparaissait lors de la 
5 purification de l'HPAH sur colonne d'afilnite Red. Nous posons done l'hypothese que 
la ou les proteines partenaires de la NADH,H+ oxydase dependante du 4-HPA n'ont pas 
ete retenus par la resine d'affinite Red 120 agarose et sont done recuperees dans le 
"flow-through". Nous decidons done de purifier le "flow-through" et de rechercher la ou 
les proteines qui ajoutees a la HPAH permettent de restorer l'activite 4-HPA 1- 

10 hydroxylase. Pour ce faire, le "flow-through" est concentree par ultrafiltration 
(Macrosep™ 10K) puis chargee sur une colonne de gel filtration S75. Un debit de 1 
mL.min" 1 est applique et les fractions de 1 mL sont collectees. On realise alors des 
reactions enzymatiques mettant en presence 50 uL de chaque fraction et 10 uL d'HPAH 
prealablement purifie sur colonne Red , dans les conditions reactionnelles normales. Les 

15 reactions stoppees sont alors analysees par HPLC. On observe que les fractions 90 a 
108, lorsque additionnees a de la proteine HPAH, permettent de produire davantage du 
metabolite Z. La production du metabolite Z est detectee dans ces mSme fractions en 
l'absence d'apport d'HPAH. Par ailleurs, sur les gels d'acrylamide correspondants a ces 
fractions, nous observons une proteine de poids moleculaire equivalent a HPAH. Nous 

20 concluons que le "flow-through" contenait encore un peu de proteine HPAH. Lorsque 
les fractions 109 a 143 sont additionnees a de la proteine HPAH, on observe la 
production d'HGA. Plus la production d'HGA est forte, plus celle du metabolite Z est 
faible. Le maximum de production d'homogentisate est obtenu pour les fractions 116 a 
128. Le depot sur gel acrylamide de des fractions comprises entre 95 et 145 montre 

25 qu'une proteine est fortement enrichie dans les fractions 109 a 143, e'est a dire que le 
profil chromatographique de cette proteine coincide avec le profil de production 
d'HGA. Nous decidons de denommer cette proteine HP AC. La proteine HP AC est 
excisees du gel puis microsequencee en N-terminal. La sequence obtenue, MTTKTFA, 
montre que cette proteine est codee par le gene 1 (Figure 7) que nous denommons 

30 dorenavant hpaC. Cette experience montre que l'activite 4-HPA 1-hydroxylase 
implique deux proteines, l'HPAH et l'HPAC. Cependant, nous n' avons pas defini la 
nature de 1' interaction entre ces deux proteines : (1) HPAH et HPAC sont elles toutes 
deux des enzymes ou bien (2) est-ce l'HPAH qui possede une activite enzymatique 
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modifiable en fonction de l'interaction avec l'HPAC. 

II.2.10.3- Nature des interactions entre HP AH et HP AC 
L'experience precedente demontre que les proteines HP AH et HP AC sont 
necessaires pour reconstituer l'activite 4-HPA 1 -hydroxylase. Deux hypotheses pour 
5 expliquer le role respectif de ces proteines sont posees. Dans ce paragraphe nous 
presentons les resultats qui suggerent que l'HPAC est une enzyme a part entiere. Les 
fractions 100, 101 et 102 de la gel filtration sont rassembles. Elles contiennent la HP AH 
c'est a dire l'activite NADH,H+ oxydase qui permet de produire le metabolite Z a partir 
du 4-HPA. Par ailleurs, les fractions 123, 124 et 125 de la gel filtration sont 

10 rassemblees. Elles contiennent la HP AC. Differentes reactions enzymatiques sont 
realisees en utilisant l'HPAH et/ou l'HPAC. Ces reactions sont realisees en deux temps. 
Une premiere reaction est realisee avec l'HPAH (respectivement HP AC), elle est 
stoppee au bout de 30 minutes par un traitement thermique (100°C, 10 min). On ajoute 
alors la HP AC (respect. HP AH) et la reaction est poursuivie pour 30 minutes. La 

15 reaction est finalement arretee par un ajout d'acide perchlorique. Des reactions sont 
aussi realisees en remplacant 1'une des enzymes par de l'eau. Enfin, des experiences 
equivalentes sont realisees en filtrant les reactions sur Nanosep™ 10 kD (Pall Filtron) au 
lieu de les bouillir. 



Le tableau N°l synthetise les resultats obtenus. 
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HPAC 
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HPAC 


HP AH 


metabolite Z 


F 


H 2 Q 


HP AH 


Metabolite Z 



20 ~ " ' ' 

Nous observons que la seule maniere de produire de l'HGA c'est d' avoir les 

deux proteines HP AH et HPAC simultanement ou successivement dans cet ordre. 

Lorsque l'HPAH est seule, ou lorsque l'HPAC est introduite avant l'HPAH, seul le 

metabolite Z est detectable. Enfin, la proteine HPAC n'a aucune activite enzymatique 
25 sur le 4-HPA. Ces resultats suggerent que le metabolite Z est un intermediaire 

reactionnel. L'HPAH convertirait le 4-HPA en metabolite Z, cette reaction permettant 
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l'oxydation du NADH,H\ Le metabolite Z serait alors convertit en HGA par la HP AC. 
Les interactions physiques entre les deux proteines n'apparaissent pas necessaires 
puisque la proteine HP AH peut etre denaturee ou eliminee par filtration avant ajout de 
l'HPAC. Nous avons montre in vitro que l'activite 4-HPA 1 -hydroxylase dependait des 
5 proteines HP AC et HP AH. Cependant la proteine HP AC n'est pas pure en sortie de gel 
filtration, elle est seulement enrichie. II reste done possible qu'en realite se soit une 
autre proteine contenue dans cet extrait enrichi qui convertisse le metabolite Z en HGA. 
Pour eliminer les doutes, nous decidons de cloner les deux genes (hpaC et hpaH) sur un 
meme vecteur, nous devrions dans ce cas produire l'activite 4-HPA 1 -hydroxylase et 

10 done etre capable de faire croitre P. putida sur milieu minimum contenant du 4-HPA 
comme seule source de carbone. 

II.2.10.4- Complementation fonctionnelle de P. putida par hpaH et hpaC 
Le plasmide pLllac2 (Figure 9) est un vecteur pBBRlMCS-Gm R contenant le 
gene hpaC sous la dependance du promoteur de l'HPPD de P. fluorescens et en 

15 opposition, le gene hpaH sous la dependance d'un promoteur lac. Le plasmide est 
introduit dans P. putida par electroporation. Les bacteries sont alors etalees sur milieu 
minimum contenant ou non du 4-HPA comme seule source de carbone. Apres 5 jours, 
les colonies sont visibles seulement sur boites contenant le 4-HPA comme seule source 
de carbone. Au bout de 8 jours, les colonies sont de belles tailles. L'ADN plasmidique 

20 extrait a partir de ces colonies confirme la presence du plasmide pLllac2 integre. Par 
ailleurs P. putida est incapable de croitre sur 4-HPA lorsque la bacterie est transformee 
avec le vecteur pBBRlMCS-GM R contenant soit le gene hpaC soit le gene hpaH. La 
complementation fonctionnelle obtenue dans cette experience confirme que les genes 
hpaC et hpaH sont necessaires et suffisants pour instaurer l'activite 4-HPA 1- 

25 hydroxylase recherchee. 

Exemple III : constructions des differentes cassettes d' expression 
cytosolique. 

ffl.1 HPAC 

30 Le gene HPAC a ete isole de Pseudomonas acidovorans par PCR sur un 

plasmide derive (p5kbC) d'une banque cosmidique d'ADN genomique, en utilisant les 
oligonucleotides suivants: 

Start ORF1 (Afllll): GCAGGATGCA CATGTCCACC AAGAC 
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ORF1 Fin (Hindlll): CGGACGCAAG CTTGCATCAG CCTTC 
La reaction a ete effectuee selon les conditions standards. Le fragment amplifie 
d'une taille de 993 pb a ete sous-clone dans le plasmide pGEMTeasy (Promega) selon le 
protocole du fournisseur. Le plasmide pOZ150 ainsi obtenu a ete sequence. La cassette 
5 obtenue par digestion EcoRI + Spel a ete clonee dans le plasmide pBluescriptII-KS+ 
ouvert par les memes enzymes pour dormer le plasmide pEPA13. Le promoteur CsVMV 
est isole du plasmide pCH27, derive du plasmide pUC19 contenant la cassette 
d'expression d'un gene de tolerance herbicide sous le controle du CsVMV. Pour cela 
une PCR standard a ete realisee sur thermocycler avec la Pfu polymerase generant des 
10 bouts francs; 1 cycle de 5 min a 95°C, 30 cycles [95°C 30 sec, 57°C 30 sec, 72°C 1 
min], 72°C 3 min. Les amorces utilisees sont: 

N-CsVMV: GCCCTCGAGG TCGACGGTAT TGATCAGCTT CC introduisant 
les sites Xhol et Bell 

C-CsVMV: CGCTCTAGAA TTCAGATCTA CAAAC (EcoRI) 
15 Le fragment de 565 pb genere est digere par XhoI+EcoRI avant d'etre insere 

dans le plasmide pEPA13 prealablement digere par XhoI+EcoRI; le plasmide pEPA14 
est obtenu. Le terminateur Nos est isole du plasmide pRDll, derive de pBlueScript II- 
SK(-) dans lequel est clone le terminateur Nos, par digestion Hindll+Notl. Le fragment 
de 292 pb obtenu est clone dans le plasmide pEPA14 ouvert par les memes enzymes, 
20 donnantpEPA15. 

Cassette pEPA15 = promoteur CsVMV-hpa C- terminateur Nos (Figure 10 ; 
SEQ ID NO 19) 

III.2. HP AH 

Le gene HP AH a isole de Pseudomonas acidovorans par PCR sur un plasmide 
25 derive (p5kbC) d'une banque cosmidique d'ADN genomique, en utilisant les 
oligonucleotides suivants: 

Start ORF2 (AflHI): CAGAGGACGA ACAACATGTC CCACC 
ORF2 Fin 3(HindIII): CTGTGGATGA AGCTTAAGAG GTTCAGGC 
La reaction a ete effectuee selon les conditions standard. Le fragment amplifie 
30 d'une taille de 1729pb a ete sous-clone bouts-francs dans le plasmide pBlueScript II SK 
digere par EcoRV. Le plasmide pEPA16 ainsi obtenu a ete sequence. Le promoteur 
CaMV 35S est isole du plasmide pCH14, derive du plasmide pBI 121 contenant la 
cassette d'expression GUS: promoteur CaMV 35S-GUS-terminateur Nos. Pour cela une 
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PCR standard a ete realisee sur thermocycleravec la Pfu polymerase generant des bouts 
francs; 1 cycle de 5 min a 95°C, 30 cycles [95°C 30 sec, 63°C 30 sec, 72°C 1 min], 
72°C 3 min. Les amorces utilisees sont: 

N-CaMV: GCATGCCTCG AGCCCACAGA TGG introduisant le site Xhol 
5 C-CaMV: CCACCCGGGG ATCCTCTAGA G introduisant le site BamHI 

Le fragment de 839 pb genere est digere par XhoI+BamHI avant d'etre insere 
dans le plasmide pEPA16 prealablement digere par Xhol + Bell; Le plasmide pEPA17 
est ainsi obtenu. Le terminateur Nos est isole du plasmide pRDll par PCR, sous les 
memes conditions que precedemment, pour 1 cycle de 5 min a 95°C, 30 cycles [95°C 30 
10 sec, 57°C 30 sec, 72°C 1 min], 72°C 3 min., avec les amorces suivantes: 

N-Nos: CAAGCTTATC GATACCGTCG ACG introduisant Hindlll 

C-Nos: GAATTGCGGC CGCAATTCCC GACCTAGGA ACATAG introduisant 
NotI et Avrll. 

Le fragment de 305 pb obtenu est digere par NotI + Hindlll avant d'etre clone 
15 dans le plasmide pEPA17 ouvert par les memes enzymes, dormant pEPA18. 

Cassette pEPA18 = promoteur CaMV 35S-hpa H- terminateur Nos (Figure 1 1 ; 
SEQIDN017). 

in.3. HPPO 

Le gene HPPO a ete isole d'Arthrobacter globiformis par PCR sur le cosmide 2A 
20 issu d'une banque cosmidique d'ADN genomique, en utilisant les oligonucleotides 
suivants: 

N-term-HPPO-Scal: GAATTCAGTA CTTCACTTAC AGTGTCCGGC 
introduisant les sites de restriction EcoRI et Seal. 

C-term-HPPO-AsuII-XhoI: GAATTCTCGA GTTCGAACAA ACTGAGTAGC 
25 AGCTCA introduisant les sites EcoRI, Xhol et AsuII 

La reaction a ete effectuee selon les conditions standard. Le fragment de 1800 pb 
obtenu est clone dans le vecteur pGEMT-easy (Promega) selon le protocole du 
fournisseur. Le plasmide pOZ151 ainsi obtenu a ete sequence. La cassette obtenue par 
digestion Sphl + Xhol a ete clonee dans le plasmide pBBRl-MCS (Gm) ouvert par les 
30 memes enzymes pour dormer le plasmide pEPA20. Le promoteur simple histone est 
isole du plasmide pCH9, derive du plasmide pUC19 contenant la cassette d'expression 
de l'EPSPS: promoteur simple histone-intron2-OTP-EPSPS-terminateur Histone. Pour 
cela une PCR standard a ete realiseeavec Pfu polymerase generant des bouts francs; 1 
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cycle de 5 min a 95°C, 5 cycles [95°C 30 sec, 45°C 30 sec, 72°C 1 min], 30 cycles 
[95°C 30 sec, 65°C 30 sec, 72°C 1 min], 72°C 3 min. Les amorces utilisees sont: 

N-SH: GCTTGCATGC CTAGGTCGAG GAGAAATATG introduisant les sites 
SphI et Avrll 

5 C-SH: CATGAGGGGT TCGAAATCGA TAAGC 

Le fragment de 970 pb genere est digere par SphI avant d'etre insere dans le 
plasmide pEPA20 prealablement digere par SphI + Seal; Dans le plasmide pEPA21 
obtenu, l'ATG d'initiation du gene HPPO est recree derriere le promoteur Simple 
Histone. Le terminateur Histone est isole du meme plasmide pCH9 par PGR, sous les 
10 memes conditions que precedemment, pour 1 cycle de 5 min a 95°C, 35 cycles [95°C 30 
sec, 55°C 30 sec, 72°C 1 min], 72°C 3 min., avec les amorces suivantes: 

N-Hister: CTAGACCTAG GGGATCCCCC GATC introduisant Avrll 
C-Hister: CCCACTAGTG TTTAAATGAT CAGTCAGGCC GAAT introduisant 
Spel et Bell. 

1 5 Le fragment de 726 pb obtenu est digere par Spel + Avrll avant d'etre clone dans 

le plasmide pEPA21 ouvert par Spel, dormant pEPA22. 

Cassette pEPA22 = promoteur simple histone-hppO-teminateur histone (Figure 
12;SEQ ID NO 15). 

III.4. Association des genes 
20 La cassette contenant le gene HP AC est extraite de pEPAl 5 par digestion NotI et 

clonee dans pEPA18 (NotI+Bspl20I) pour former pEPA19 (Figure 13 ; SEQ ID NO 
21). Ce dernier est digere par Avrll pour doner la cassette extraite dans les sites 
Avrll+Spel de pEPA22. Le plasmide contenant les trois constructions est pEPA23 
(Figure 14 ; SEQ ID NO 22). 
25 III.5. Vecteur binaire 

Afin de transformer les plantes par Agrobacterium, les trois constructions sont 
extractibles par Bell afin d'etre introduites dans un vecteur binaire d'Agrobacteries. 
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Abrogations 
3,4-DHPA 
4-HPA 
ADN 
5 APcI 
ARN 
ARNm 
BET 
BLAST 
10 BSA 
c ioo 

CRLD 

Da 

DKN 
15 DMSO 

dATP 

dCTP 

dGTP 

dNTP 
20 dTTP 

DTE 

DTT 

EDTA 

FAD 
25 FPLC 

Gm 20 

HGA 

HPLC 

HPP 
30 HPPD 

HPPO 

IFT 

IPTG 



acide 3,4-dihydoxyphenylacetique 

acide 4-hydroxyphenylacetique 

acide desoxyribonucleique 

Ionisation chimique a Pression Atmospherique 

acide ribonucleique 

acide ribonucleique messager 

bromure d'ethidium 

Basic Local Alignment Search Tool 

albumine de serum bovin 

carbenicilline (100 (ig/mL) 

Centre de Recherche La Dargoire 

Dalton 

dicetonitrile de risoxaflutole 

dimethylsulfoxyde 

2 ' desoxyadenosine 5 ' -triphosphate 

2'desoxycytidine 5 '-triphosphate 

2'desoxyguanosine 5 '-triphosphate 

2 ' -desoxynucleotides 5 ' -triphosphate 

2'desoxythymidine 5 '-triphosphate 

dithioerithriol 

1,4-dithiothreitol 

acide ethylene diamine tetraacetique 

flavine adenine dinucleotide 

"fast protein liquid chromatography " 

gentamycine (20|ng/mL) 

acide homogentisique 

chromatographie liquide haute performance 

acide hydroxyphenylpyruvique 

acide hydroxyphenylpyruvrique dioxygenase 

hydroxyphenylpyruvate oxydase 

isoxafiutole 

isopropyl-P-thiogalactopyranoside 
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Kn 50 


kanamycine (50 |J.g/mL) 




kb 


kilo bases 




Km 


constante de Michaelis Menten 




L-DOPA 


3 ,4-dihydroxyphenylalanine 


5 


LB 


milieu de Luria Bertani 




min 


minutes 




mJ 


milli-joules 




MNDD 


manganese dependant dioxygenase 




MndD 


gene codant la MNDD 


10 


NAD + (H,H + ) 


nicotinamide adenine dinucleotide (forme oxydee/forme 






reduite) 




OGM 


Organisme genetiquement modifie 




OTP 


Optimised Transit Peptid ; peptide de transit optimise 




pb 


paire de bases 


15 


pBBRlMCS-Gm 


plasmide pBBRlMCS resistant a la gentamycine 




PCR 


reaction de polymerisation en chaine 




ppm 


partie par million; mg.1/ 1 




PVDF 


polyvinylene difluoride 




qsp 


quantite suffisante pour 


20 


Q.r. 


coefficient respiratoire 




Rif 100 


Rifampicine (100 ug/mL) 




RMN 


resonance magnetique nucleaire 




SDS 


dodecyle sulfate de sodium 




sec 


seconde 


25 


TBE 


tris borate EDTA 




TEV 


" tobacco etch virus " 




TFA 


acide trifluoroacetique 




TrEMBL 


banque genomique EMBL traduite (translated EMBL 




bank) 




30 


Tris 


tris(hydroxymethyl)aminomethane 




U.V. 


ultra-violet 




vs 


versus 




X-gal 


5-bromo-4-chloro-3-P-D-galactopyranoside 
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1. Procede permettant de rendre les plantes tolerantes a un herbicide 
caracterise en ce que Ton exprime dans lesdites plantes au moins une enzyme 

5 permettant le contournement de la voie metabolique inhibee par ledit herbicide. 

2. Procede selon la revendication 1, caracterise en ce que l'herbicide est un 
inhibiteur d'HPPD. 

3. Procede selon la revendication 2, caracterise en ce que Ton exprime dans 
la plante une HPP oxydase et/ou une HP AH et/ou une HP AC. 

1 0 4. Polypeptide, caracterise en ce qu'il possede une activite HPP oxydase. 

5. Polypeptide selon la revendication 4, caracterise en ce qu'il est insensible 
aux inhibiteurs d'HPPD. 

6. Polypeptide selon l'une des revendications 4 ou 5, caracterise en ce qu'il 
comprend la sequence d'acides amines de la SEQ ID NO 2, ses fragments et ses 

15 sequences homologues. 

7. Polypeptide selon la revendication 6, caracterise en ce qu'il comprend 
une sequence d'acides amines selectionnee parmi le groupe comprenant SEQ ID NO 4 
et SEQ ID NO 6, leurs fragments et leurs sequences homologues 

8. Polypeptide, caracterise en ce qu'il possede une activite HP AH. 

20 9. Polypeptide selon la revendication 8, caracterise en ce qu'il est insensible 

aux inhibiteurs d'HPPD. 

10. Polypeptide selon l'une des revendications 8 ou 9, caracterise en ce qu'il 

comprend la sequence d'acides amines de la SEQ ID NO 8, ses fragments et ses 

sequences homologues. 
25 11. Polypeptide, caracterise en ce qu'il possede une activite HP AC. 

12. Polypeptide selon la revendication 11, caracterise en ce qu'il est 
insensible aux inhibiteurs d'HPPD. 

13. Polypeptide selon l'une des revendications 11 ou 12, caracterise en ce 
qu'il comprend la sequence d'acides amines de la SEQ ID NO 10, ses fragments et ses 

30 sequences homologues. 

14. Polypeptide selon la revendication 13, caracterise en ce qu'il comprend 
une sequence d'acides amines selectionnee parmi le groupe comprenant SEQ ID NO 12 
et SEQ ID NO 14, leurs fragments et leurs sequences homologues 
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15. Sequence d'acide nucleique caracterisee en ce qu'elle code pour un 
polypeptide selon l'une des revendications 4 a 14. 

16. Sequence d'acide nucleique codant pour une HPP oxydase, caracterisee 
5 en ce qu'elle comprend une sequence d'acide nucleique selectionnee parmi le groupe 

comprenant les sequences codantes des SEQ ID NO 1, SEQ ID NO 3, SEQ ID NO 5 ou 
SEQ ID NO 15, leurs sequences homologues, leurs fragments et les sequences capables 
de s'hybrider de maniere selective aux dites SEQ ID NO 1, 3, 5 ou 15. 

17. Sequence d'acide nucleique codant pour une HP AH, caracterisee en ce 
10 qu'elle comprend une sequence d'acide nucleique selectionnee parmi le groupe 

comprenant les sequences codantes des SEQ ID NO 7 ou SEQ ID NO 17, leurs 
sequences homologues, leurs fragments et les sequences capables de s'hybrider de 
maniere selective aux dites SEQ ID NO 7 ou 17. 

18. Sequence d'acide nucleique codant pour une HP AC, caracterisee en ce 
15 qu'elle comprend une sequence d'acide nucleique selectionnee parmi le groupe 

comprenant les sequences codantes des SEQ ID NO 9, SEQ ID NO 1 1, SEQ ID NO 13 
ou SEQ ID NO 19, leurs sequences homologues, leurs fragments et les sequences 
capables de s'hybrider de maniere selective aux dites SEQ ID NO 9, 1 1, 13 ou 19. 

19. Cassette d'expression comprenant une sequence codante, caracterisee en 
20 ce que la sequence codante comprend une sequence d'acide nucleique selon l'une des 

revendications 15 a 18. 

20. Vecteur de clonage et/ou d'expression, caracterise en ce qU'il comprend 
au moins une cassette d'expression selon la revendication 19. 

21. Cellule vegetale transformee, caracterisee en ce qu'elle comprend au 
25 moins une cassette d'expression selon la revendication 1 9. 

22. Plante transformee, caracterisee en ce qu'elle comprend au moins une 
cassette d'expression selon la revendication 19. 

23. Graines de plantes transformers selon la revendication 22, caracterisees 
en ce qu'elles comprennent au moins une cassette d'expression selon la revendication 

30 19. 

24. Procede de transformation des plantes, caracterise en ce que Ton intorduit 
dans leur genome au moins une cassette d'expression selon la revendication 19. 
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25. Procede de desherbage selectif de plantes, notamment de cultures, a l'aide 
d'un inhibiteur de 1'HPPD, caracterise en ce qu'on applique cet herbicide sur des plantes 

5 transformees selon la revendication 22. 

26. Procede de controle des mauvaises herbes dans une surface d'un champ 
comprenant des graines selon la revendication 23 ou des plantes transformees selon la 
revendication 22, caracterise en ce qu'il comprend 1' application dans la dite surface du 
champ d'une dose toxique pour les dites mauvaises herbes d'un herbicide inhibiteur 

10 d'HPPD, sans toutefois affecter de maniere substantielle les graines ou plantes 
transformee selon l'invention. 

27. Procede de culture des plantes transformees selon la revendication 22, 
caracterise en ce qu'il comprend le semis des graines selon la revendication 23 dans une 
surface d'un champ approprie pour la culture des dites plantes, l'application sur la dite 

15 surface du dit champ une dose toxique pour les mauvaises herbes d'un herbicide ayant 
pour cible l'HPPD en cas de presence de mauvaises herbes, sans affecter de maniere 
substantielle les dites graines ou les dites plantes transformees, puis la recolte des 
plantes cultivees lorsqu'elles arrivent a la maturite souhaitee et eventuellement la 
separation des graines des plantes recoltees. 

20 28. Procede selon l'une des revendications 25 a 27, caracterise en ce que 

l'herbicide est appliqu£ en pre-semis et/ou en post-levee. 
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Sequence codant le peptide N-terminal 



Hin dm (2660) 



S6quence codant le peptide N°6 



D 



hppO 1 



Pi) M n(5054; 



Sac I (2955) 



Figure 3 



2901 TTTGGAAATC 
AAACCTTTAG 



GACGGGATCC AGCGGACCAG CACTGCCATC TCCGTCGTGG 
CTGCCCTAGG TCGCCTGGTC GTGACGGTAG AGGCAGCACC 



2951 AGCTCATGCC 
TCGAGTACGG 



3001 GAGAGCCGCC 
CTCTCGGCGG 



3051 ATATTTGCAG 
TATAAACGTC 



GCCCCGCTAT GACGGCCTGC TGGCCCGGCT GTCCCAGCAG 
CGGGGCGATA CTGCCGGACG ACCGGGCCGA CAGGGTCGTC 



ATCCCAGCTA GGGCATAGGT GATCCGCACC ACCTTTGAGC 
TAGGGTCGAT CCCGTATCCA CTAGGCGTGG TGGAAACTCG 



TAGCTACTGT GATAAACTGC dMMMA c.C AGCTCATGTC 
ATCGATGACA CTATTTGACG GTTTTTATGG TCGAGTACAG 



3101 TGTTCACTTG 
ACAAGTGAAC 



CCAATCGCTG ATCCAGATCC GACGATTCCT GCATGACTTC 
GGTTAGCGAC TAGGTCTAGG CTGCTAAGGA CGTACTGAAG 



3151 ACTTACAGTG 
TGAATGTCAC 



TCCGGCCGGG TGGCGCAGGT CCTCAGCAGC TATGTCAGCG 
AGGCCGGCCC ACCGCGTCCA GGAGTCGTCG ATACAGTCGC 



+ 2 > 

4 8 01 GGCGAAGGAG GCGGTGGCGG GCTAGGGCCG GCCTCGTCGA AATGCCGCCC 
CCGCTTCCTC CGCCACCGCC CGATCCCGGC CGGAGCAGCT TTACGGCGGG 

4851 TCCAACCCAA CTCAGTACCA GCTCAGGGCG TTCTCAGGGC TGGGAACGCC 
AGGTTGGGTT GAGTCATGGT CGAGTCCCGC AAGAGTCCCG ACCCTTGCGG 
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LISTE DE SEQUENCES 

<110> Aventis CropScience S.A. 

<120> Plantes tolerantes aux herbicides par contournement de 
voie metabolique 

<130> genes du shunt 

<140> 
<141> 

<160> 22 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 1683 
<212> ADN 

<213> Arthrobacter globiformis 

<220> 

<221> CDS 

<222> (1) . . (1683) 

<400> 1 

atg act tea ctt aca gtg tec ggc egg gtg gcg cag gtc etc age age 48 
Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser Ser 
15 10 15 

tat gtc age gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac ttc 96 
Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe 
20 25 30 

ctg gac gec gec gag aag gag ggc etc cgc ttc acg gec gta cgc cat 14 4 
Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His 
35 40 45 

gaa ggt gec gec ate gcg gcg gcg gac gec tac tat egg gca tec ggg 192 
Glu Gly Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly 
50 55 60 

cgc ctg gcg gcg ggg acc acc acc tac ggc ccc ggt tac acc aac gec 24 0 
Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala 
65 70 75 80 

ctg acg gec etc gee gag gcg gtc cag gcg cag ate ccc gtg gtg etc 288 
Leu Thr Ala Leu Ala Glu Ala Val Gin Ala Gin He Pro Val Val Leu 
85 90 95 

gtc acc ggg gac gec ccg age age ggc gec egg cct tgg gac gtg gac 336 
Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp 
100 105 110 

cag gee gcg ate gec gec ggg ctg ggg gcg gcg acc ttc acg gtc acc 384 
Gin Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr 
115 120 125 

cgt gaa gec gca ggc tec ate acg cag gaa gcg gtg gag tac gca ctt 432 
Arg Glu Ala Ala Gly Ser He Thr Gin Glu Ala Val Glu Tyr Ala Leu 
130 135 140 

gec egg egg acc gec gtc gtg ate gec gtt cca tac gac ctg teg gec 4 80 
Ala Arg Arg Thr Ala Val Val He Ala Val Pro Tyr Asp Leu Ser Ala 
145 150 155 160 

ctt gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg, gcg gec teg gtt 528 
Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro' Ala Ala Ser Val 
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165 170 175 

ccg gac gcc ate ggc ggc gga etc gga egg gcg gee gaa gtg egg gcg 57 6 
Pro Asp Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala 
180 185 190 

gcc gaa ttg ctg gcg ggc gcg aag egg ccg etc ate ctt gcc ggc cgc 624 
Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly Arg 
195 200 205 

ggt gcg cac etc gca gga gcc ggc ccc gaa etc egg gaa etc gcc gac 672 
Gly Ala His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp 
210 215 220 

cgc etc ggc gcg etc acg gcc ggc acc gca ctg gcg ctg aac ctg ctg 720 
Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu 
225 230 235 240 

cag ggc gag ggg tac etc ggc gtc gcg ggc ggc ttc ggc acg gat acc 768 
Gin Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr 
245 250 255 

gcc gcc ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga gcc 816 
Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala 
260 265 270 

age ctg acc ccc ttc acc atg cgc ttc ggc cac ctg ate ggc ccg gac 864 
Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu He Gly Pro Asp 
275 280 285 

gcc acc gtg ate cag ate gac acc gcc atg gag ccg acg gac ccg egg 912 
Ala Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg 
290 295 300 

gtg gac ctg ttt gtc agt gcg gac gcg aag gcc get gcc ggc egg ate 960 
Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He 
305 310 315 320 

etc egg ctg ctg gat gac gcc gcc ggg gcc aat gcg teg aag gcc tgg 1008 
Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp 
325 330 335 

cgc gcg gaa gca etc aag cgt ctg gcc gaa gga ccc tgc cac cac ccc 1056 
Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro 
340 345 350 

ggc acc gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt get 1104 
Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala 
355 360 365 

teg gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac 1152 
Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp 
370 375 " 380 

ggc ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc ate ccc cgt 1200 
Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arg 
385 390 395 400 

cct cag gac ctg gtc atg gtg ggg acc gcg tac cag teg ate ggg ctt 124 8 
Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu 
405 410 415 

ggc ctg gcc age gcc gtg ggg gcg tec egg gcc gtg gac gac ggc aat 1296 
Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn 
420 425 430 

ate ctg gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tec 1344 
He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser 
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gac ctg gaa teg etc gtg ggc gcg gcg age age gee gtc gtg gtg ate 1392 

Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He 
450 455 460 

tac aac gac gee gee tac ggg gee gag ate cat cag tac ggc tea egg 1440 

Tyr Asn Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg 
465 470 475 480 

ggg etc ace gaa aag ccc atg ctg ate ccc gaa gtg gac ttc age ggg 1488 

Gly Leu Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly 
485 490 495 

att gee cgc gcg ate ggg gcg gaa tec gca ate ate cgc aag ctg teg 1536 

He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser 

500 505 510 

gac etc tec gcg etc acg gac tgg ate gag gee ggc gee agg gga acc 1584 

Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr 
515 520 525 

ttc gtg gee gac tgc cgc ate acc tea age gtc egg gee ccg tgg ctg 1632 

Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu 
530 535 540 

age gaa tgg atg agg gec teg caa gcg gcg aag gag gcg gtg gcg ggc 1680 

Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
545 550 555 560 



<210> 2 
<211> 561 
<212> 

<213> Arthrobacter globiformis 
<400> 2 

Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser Ser 
15 10 15 

Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe 
20 25 30 

Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His 
35 40 45 

Glu Gly Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly 
50 55 60 

Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala 
65 70 75 80 

Leu Thr Ala Leu Ala Glu Ala Val Gin Ala Gin He Pro Val Val Leu 
85 90 95 

Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp 
100 105 110 

Gin Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr 
115 120 125 

Arg Glu Ala Ala Gly Ser He Thr Gin Glu Ala Val Glu Tyr Ala Leu 
130 135 140 

Ala Arg Arg Thr Ala Val Val He Ala Val Pro Tyr Asp Leu Ser Ala 
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145 



150 



155 



160 



Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val 
165 " 170 175 

Pro Asp Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala 
180 185 190 

Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly Arg 
195 200 205 

Gly Ala His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp 
210 215 220 

Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu 
225 230 235 240 

Gin Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr 
245 250 255 



Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala 

260 265 270 

Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu He Gly Pro Asp 
275 280 285 



Ala Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg 

290 295 300 

Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He 

305 310 315 320 



Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp 
325 330 335 

Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro 
340 345 350 

Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala 
355 360 365 

Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp 
370 375 380 

Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arg 
385 390 395 400 

Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu 
405 410 415 

Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn 
420 425 430 

He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser 
435 440 445 

Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He 
450 455 460 

Tyr Asn Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg 
465 470 475 480 

Gly Leu Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly 



485 



490 



495 



He Ala 



Arg Ala He Gly Ala Glu Ser Ala He He Arg 
500 505 



Lys Leu Ser 
510 
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Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr 
515 520 525 

Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu 
530 535 540 

Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala 
545 550 555 560 



<210> 3 
<211> 1944 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle: mutant 
d'HPPO d'A. globiformis 

<220> 
<221> CDS 

<222> (55) . . (1737) 
<400> 3 

ccgacgtcgc atgctcccgg ccgccatggc ggccgcggga attcgattga attc atg 57 

Met 
1 

act tea ctt aca gtg tec ggc egg gtg gcg cag gtc etc age age tat 105 
Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser Ser Tyr 
5 10 15 

gtc age gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac ttc ctg 153 
Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu 
20 25 30 

gac gee gee gag aag gag ggc etc cgc ttc acg gee gta cgc cat gaa 201 
Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His Glu 
35 40 45 

ggt gee gee ate gcg gcg gcg gac gee tac tat egg gca tec ggg cgc 24 9 
Gly Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly Arg 
50 55 60 65 

ctg gcg gcg ggg ace ace ace tac ggc ccc ggt tac ace aac gee ctg 297 
Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala Leu 
70 75 80 

acg gee etc gee gag gcg gtc cag gcg cag ate ccc gtg gtg etc gtc 345 
Thr Ala Leu Ala Glu Ala Val Gin Ala Gin He Pro Val Val Leu Val 
85 90 95 

ace ggg gac gee ccg age age ggc gee egg cct tgg gac gtg gac cag 393 
Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gin 
100 105 110 

gee gcg ate gee gee ggg ctg ggg gcg gcg ace ttc acg gtc ace cgt 441 
Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg 
115 120 125 

gaa gee gca ggc tec ate acg cag gaa gcg gtg gag tac gca ctt gee 489 
Glu Ala Ala Gly Ser He Thr Gin Glu Ala Val Glu Tyr Ala Leu Ala 
130 135 140 145 

egg egg acc gec gtc gtg ate gee gtt cca tac gac ctg teg gee ctt 537 
Arg Arg Thr Ala Val Val He Ala Val Pro Tyr Asp Leu Ser Ala Leu 
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gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg gcg gcc teg gtt ccg 585 
Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro 
165 170 175 

gac gcc ate ggc ggc gga etc gga egg gcg gcc gaa gtg egg gcg gcc 633 
Asp Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala 
180 185 190 

gaa ttg ctg gcg ggc gcg aag egg ccg etc ate ctt gcc ggc cgc ggt 681 
Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly Arg Gly 
195 200 205 

gcg cac etc gca gga ace ggc ccc gaa etc egg gaa etc gcc gac cgc 729 
Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg 
210 215 220 225 

etc ggc gcg etc acg gcc ggc ace gca ctg gcg ctg aac ctg ctg cag 777 
Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gin 
230 235 240 

ggc gag ggg tac etc ggc gtc gcg ggc ggc ttc ggc acg gat ace gcc 825 
Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala 
245 250 255 

gcc ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga gcc age 873 
Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser 
260 265 270 

ctg acc ccc ttc acc atg cgc ttc ggc cac ctg ate ggc ccg gac gcc 921 
Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu He Gly Pro Asp Ala 
275 280 285 

acc gtg ate cag ate gac acc gcc atg gag ccg acg gac ccg egg gtg 969 
Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val 
290 295 300 305 

gac ctg ttt gtc agt gcg gac gcg aag gcc get gcc ggc egg ate etc 1017 
Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He Leu 
310 315 ~ 320 

egg ctg ctg gat gac gcc gcc ggg gcc aat gcg teg aag gcc tgg cgc 1065 
Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg 
325 330 335 

gcg gaa gca etc aag cgt ctg gcc gaa gga ccc tgc cac cac ccc ggc 1113 
Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly 
340 345 " 350 

acc gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt get teg 1161 
Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser 
355 360 365 

gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac ggc 1209 
Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp Gly 
370 375 380 385 

ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc ate ccc cgt cct 1257 
Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arg Pro 
390 395 400 

cag gac ctg gtc atg gtg ggg acc gcg tac cag teg ate ggg ctt ggc 1305 
Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu Gly 
405 410 415 

ctg gcc age gcc gtg ggg gcg tec egg gcc gtg gac gac ggc aat ate 1353 
Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn He 
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ctg gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tec gac 14 01 
Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp 
435 440 445 

ctg gaa teg etc gtg ggc gcg gcg age age gee gtc gtg gtg ate tac 14 4 9 
Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val lie Tyr 
450 455 460 465 

aac gac gec gee tac ggg gee gag ate cat cag tac ggc tea egg ggg 14 97 
Asn Asp Ala Ala Tyr Gly Ala Glu lie His Gin Tyr Gly Ser Arg Gly 
470 475 480 

etc ace gaa aag ccc atg ctg ate ccc gaa gtg gac ttc age ggg att 1545 
Leu Thr Glu Lys Pro Met Leu lie Pro Glu Val Asp Phe Ser Gly lie 
485 490 495 

gec cgc gcg ate ggg gcg gaa tec gca ate ate cgc aag ctg teg gac 1593 
Ala Arg Ala lie Gly Ala Glu Ser Ala lie lie Arg Lys Leu Ser Asp 
500 505 510 

etc tec gcg etc acg gac tgg ate gag gee ggc gee agg gga acc ttc 1641 
Leu Ser Ala Leu Thr Asp Trp lie Glu Ala Gly Ala Arg Gly Thr Phe 
515 520 525 

gtg gee gac tgc cgc ate acc tea age gtc egg gee ccg tgg ctg age 1689 
Val Ala Asp Cys Arg lie Thr Ser Ser Val Arg Ala Pro Trp Leu Ser 
530 535 540 545 

gaa tgg atg agg gec teg caa gcg gcg aag gag gcg gtg gcg ggc tag 1737 
Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
550 555 560 

ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca gggcgttctc 17 97 

agggctggga acgccctgag ctgctactca tttgttcgaa ctcgagaatt caatcactag 1857 

tgaattcgcg gccgcctgca ggtcgaccat atgggagagc tcccaacgcg ttggatgcat 1917 

agcttgagta ttctatagtg tcaccta 1944 

<210> 4 
<211> 561 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: mutant 
d'HPPO d'A. globiformis 

<400> 4 

Met Thr Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser Ser 
1 5 ' 10 15 

Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe 
20 25 30 

Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His 
35 40 45 

Glu Gly Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly 
50 55 60 

Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala 
65 70 75 80 

Leu Thr Ala Leu Ala Glu Ala Val Gin Ala Gin He Pro Val Val Leu 
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• Gly Asp 
100 

i Ala He 
115 

Ala Ala 
Arg Thr 
Leu Glu Ala Ala 



Arg Glu i 
130 



Ala Arg 
145 



Ala Pro 
Ala Ala 
Gly Ser 



Ala Val 
150 



Glu Glu 
165 



Pro Asp 
Ala Glu 



Gly Ala 
210 



Arg Leu 
225 



Gin Gly 
Ala Ala 



Ala He 
180 



Gly Gly 
Ala Gly 
His Leu Ala Gly 



Leu Leu i 
195 



Gly Leu 
120 

He Thr 
135 

Val He 
Asp Leu 
Gly Leu 



Ala Lys 
200 



Thr Gly 
215 



• Gly Ala 
105 

Gly Ala 
Gin Glu 
Ala Val 



Pro Val 
170 



Gly Arg 
185 



Arg Pro 
Ala Thr 



Ala Val 
140 



Pro Tyr 
155 



Pro Pro 
Ala Ala 



Trp Asp 
110 



Phe Thr 
125 



Val Asp 
Val Thr 



Glu Tyr Ala Leu 
Asp Leu 
Ala Ala 



Ser Ala 
160 



Arg Pro Leu He 
Pro Glu 



Glu Val 
190 



Leu Ala 
205 



Gly Ala 
Glu Gly 



Gly Leu 
260 



Ser Leu Thr Pro 
275 



Ala Thr ^ 
290 

Val Asp ] 
305 

Leu Arg ] 

Arg Ala 

Gly Thr 

Ser Ala 
370 

Gly Gly 
385 

Pro Gin 
Gly Leu 
He Leu 
Asp Leu 



Glu Ala 
340 

Ala Glu 
355 

Leu Asp 
His Phe 
Asp Leu 



Leu Thr 

230 

Tyr Leu 
245 

Met Gly 

Phe Thr 

i Gin He 

: Val Ser 
310 

[ Asp Asp 
325 

Leu Lys 
Thr Thr 
Ala Val 



Ala Gly Thr Ala 
Gly Val 
Glu Ala 



Ala Gly 
250 



Met Arg 
280 

Asp Thr 

295 

Ala Asp 
Ala Ala 
Arg Leu 



Asp Gly 
360 



Leu Pro 
375 



Leu Gly ! 
390 



Val Met ' 
405 



Trp Ala 

Val Gly 

Gly Ala 

Gly Asp 
440 

Glu Ser Leu Val Gly Ala 



. Asp Val 
265 

Phe Gly 

Ala Met 

Ala Lys 

Gly Ala 
330 

Ala Glu 
345 

Arg Leu 
Glu Arg 
Pro Met 



. Leu Arg ( 
220 

Leu Ala : 
235 

Gly Phe ( 
Val Leu 
His Leu 



Val Ala 
270 



He Gly 
285 



Glu Pro ' 
300 



Thr Asp 
Ala Gly 
Asn Ala Ser Lys 



Ala Ala . 
315 



Ala Ser 
420 



Val Leu 
435 



Thr Ala 
410 



Ser Arg 
425 



Gly Pro 
Asp Pro 



Arg Thr 
380 



Tyr Trp 
395 



Tyr Gin 
Ala Val 



Cys His 
350 

Arg Ala 
365 

Val Val 
Arg He 
Ser He 



. Ser Val 
175 

Arg Ala 

Gly Arg 

i Ala Asp 

i Leu Leu 
240 

■ Asp Thr 
255 

Gly Ala 

Pro Asp 

Pro Arg 

Arg He 
320 

Ala Trp 
335 

His Pro 
Leu Ala 
Gin Asp 



Pro Arg 
400 



Gly Leu 
415 



Gly Gly Phe Leu 
Ala Ser 



Gly Asn 
Leu Ser 

Ser Ala Val Val Val He 



Asp Asp ( 
430 



Met Gly : 
445 
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Tyr Asn Asp Ala Ala Tyr Gly Ala Glu lie His Gin Tyr Gly Ser Arg 
465 470 475 480 

Gly Leu Thr Glu Lys Pro Met Leu lie Pro Glu Val Asp Phe Ser Gly 
485 490 495 

He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser 
500 505 510 

Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr 
515 520 525 

Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu 
530 535 540 

Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
545 550 555 560 



<210> 5 
<211> 1962 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 
d'HPPO d'A. globiformis 

<220> 
<221> CDS 

<222> (111) . . (1793) 
<400> 5 

aggtgacact atagaatact caagctatgc atccaacgcg ttgggagctc tcccatatgg 60 

tcgacctgca ggcggccgcg aattcactag tgattggaag gatccggtgc atg act 116 

Met Thr 
1 

tea ctt aca gtg tec ggc egg gtg gcg cag gtc etc age age tat gtc 164 
Ser Leu Thr Val Ser Gly Arg Val Ala Gin Val Leu Ser Ser Tyr Val 
5 10 15 

age gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac ttc ctg gac 212 
Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu Asp 
20 25 30 

gec gec gag aag gag ggc etc cgc ttc acg gec gta cgc cat gaa ggt 260 
Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His Glu Gly 
35 40 45 50 

gec gec ate gcg gcg gcg gac gec tac tat egg gca tec ggg cgc ctg 308 
Ala Ala He Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly Arg Leu 
55 60 65 

gcg gcg ggg acc acc acc tac ggc ccc ggt tac acc aac gec ctg acg 356 
Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala Leu Thr 
70 75 80 

gee etc gec gag gcg gtc cag gcg cag ate ccc gtg gtg etc gtc acc 404 
Ala Leu Ala Glu Ala Val Gin Ala Gin lie Pro Val Val Leu Val Thr 
85 90 95 

ggg gac gee ccg age age ggc gec egg cct tgg gac gtg gac cag gee 452 
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Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gin Ala 
100 105 110 

gcg ate gec ggc ggg ctg ggg gcg gcg acc ttc acg gtc acc cgt gaa 500 
Ala He Ala Gly Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg Glu 
115 120 125 130 

gec gca ggc tec ate acg cag gaa gcg gtg gag tac gca ctt gee egg 548 
Ala Ala Gly Ser He Thr Gin Glu Ala Val Glu Tyr Ala Leu Ala Arg 
135 140 145 

egg acc gec gtc gtg ate gec gtt cca tac gac ctg teg gee ctt gag 596 
Arg Thr Ala Val Val He Ala Val Pro Tyr Asp Leu Ser Ala Leu Glu 
150 155 160 

gcg gca gag gaa gat ctt ccc gtg ccg ccg gcg gec teg gtt ccg gac 644 
Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro Asp 
165 170 175 

gee ate ggc ggc gga etc gga egg gcg gee gaa gtg egg gcg gee gaa 692 
Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala Glu 
180 185 190 

ttg ctg gcg ggc gcg aag egg ccg etc ate ctt gec ggc cgc ggt gcg 740 
Leu Leu Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly Arg Gly Ala 
195 ' 200 205 210 

eac etc gca gga gec ggc ccc gaa etc egg gaa etc gec gac cgc etc 788 
His Leu Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg Leu 
215 220 225 

ggc gcg etc acg gec ggc acc gca ctg gcg ctg aac ctg ctg cag ggc 836 
Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gin Gly 
230 235 240 

gag ggg tac etc ggc gtc gcg ggc ggc ttc ggc acg gat acc gec gee 884 
Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala Ala 
245 250 255 

ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga gee age ctg 932 
Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser Leu 
260 265 270 

acc ccc ttc acc atg cgc ttc ggc cac ctg ate ggc ccg gac gee acc 980 
Thr Pro Phe Thr Met Arg Phe Gly His Leu He Gly Pro Asp Ala Thr 
275 280 285 290 

gtg ate cag ate gac acc gee atg gag ccg acg gac ccg egg gtg gac 1028 
Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val Asp 
295 300 305 

ctg ttt gtc agt gcg gac gcg aag gee get gec ggc egg ate etc egg 107 6 
Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He Leu Arg 
310 315 320 

ctg ctg gat gac gec gee ggg gec aat gcg teg aag gec tgg cgc gcg 1124 
Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg Ala 
325 330 335 

gaa gca etc aag cgt ctg gee gaa gga ccc tgc cac cac ccc ggc acc 1172 
Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly Thr 
340 345 350 

gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt get teg gca 1220 
Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser Ala 
355 360 365 370 

ctg gat gee gtc ctg ccg gaa cgc cgc acc gtg gtc cag gac ggc ggg 1268 
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Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp Gly Gly 
375 380 385 

cac ttc ctg ggc tgg gca ccc atg tac tgg cgc ate ccc cgt cct cag 1316 
His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg lie Pro Arg Pro Gin 
390 395 400 

gac ctg gtc atg gtg ggg acc gcg tac cag teg ate ggg ctt ggc ctg 1364 
Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu Gly Leu 
405 410 415 

gec age gee gtg ggg gcg tec egg gee gtg gac gac ggc aat ate ctg 1412 
Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn He Leu 
420 425 430 

gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg tec gac ctg 14 60 
Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp Leu 
435 440 445 450 

gaa teg etc gtg ggc gcg gcg age age gee gtc gtg gtg ate tac aac 1508 
Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He Tyr Asn 
455 460 465 

gat gee gee tac ggg gee gag ate cat cag tac ggc tea egg ggg etc 1556 
Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg Gly Leu 
470 475 480 

acc gaa aag ccc atg ctg ate ccc gaa gtg gac ttc age ggg att gee 1604 
Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly lie Ala 
485 490 495 

cgc gcg ate ggg gcg gaa tec gca ate ate cgc aag ctg teg gac etc 1652 
Arg Ala He Gly Ala Glu Ser Ala lie lie Arg Lys Leu Ser Asp Leu 
500 505 510 

tec gcg etc acg gac tgg ate gag gee ggc gec agg gga acc ttc gtg 1700 
Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr Phe Val 
515 520 525 530 

gec gac tgc cgc ate acc tea age gtc egg gec ccg tgg ctg age gaa 1748 
Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu Ser Glu 
535 540 545 

tgg atg agg gee teg caa gcg gcg aag gag gcg gtg gcg ggc tag 17 93 

Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
550 555 560 

ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca gggcgttctc 1853 

agggctggga acgccctgag ctgctactca gtttgttcga actcgagaat tcaatcgaat 1913 

tcccgcggcc gecatggegg cegggagcat gegaegtegg gcccattcg 1962 

<210> 6 
<211> 541 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: mutant 
d'HPPO d'A. globiformis 

<400> 6 

Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr Phe Leu Asp Ala Ala 
15 10 15 



Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg His Glu Gly Ala Ala 
20 25 30 
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lie Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser Gly Arg Leu Ala Ala 
35 40 45 

Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn Ala Leu Thr Ala Leu 
50 55 60 

Ala Glu Ala Val Gin Ala Gin He Pro Val Val Leu Val Thr Gly Asp 
65 70 75 80 

Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val Asp Gin Ala Ala He 
85 90 95 

Ala Gly Gly Leu Gly Ala Ala Thr Phe Thr Val Thr Arg Glu Ala Ala 
100 105 110 

Gly Ser He Thr Gin Glu Ala Val Glu Tyr Ala Leu Ala Arg Arg Thr 
115 120 125 

Ala Val Val He Ala Val Pro Tyr Asp Leu Ser Ala Leu Glu Ala Ala 
130 135 140 

Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser Val Pro Asp Ala He 
145 150 155 160 

Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg Ala Ala Glu Leu Leu 
165 170 175 

Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly Arg Gly Ala His Leu 
180 185 190 

Ala Gly Ala Gly Pro Glu Leu Arg Glu Leu Ala Asp Arg Leu Gly Ala 
195 200 205 

Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu Leu Gin Gly Glu Gly 
210 215 220 

Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp Thr Ala Ala Gly Leu 
225 230 235 240 

Met Gly Glu Ala Asp Val Val Leu Val Ala Gly Ala Ser Leu Thr Pro 
245 250 255 

Phe Thr Met Arg Phe Gly His Leu He Gly Pro Asp Ala Thr Val He 
260 265 270 

Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro Arg Val Asp Leu Phe 
275 280 285 

Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg He Leu Arg Leu Leu 
290 295 300 

Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp Arg Ala Glu Ala 
305 310 315 320 

Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro Gly Thr Ala Glu 
325 330 335 

Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala Ser Ala Leu Asp 
340 345 350 

Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp Gly Gly His Phe 
355 360 365 

Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro Arg Pro Gin Asp Leu 
370 375 380 

Val Met Val Gly Thr Ala Tyr Gin Ser lie Gly Leu Gly Leu Ala Ser 
385 390 395 " 400 
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Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn lie Leu Val Leu 
405 410 415 

Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser Asp Leu Glu Ser 
420 425 ' 430 

Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He Tyr Asn Asp Ala 
435 440 445 

Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg Gly Leu Thr Glu 
450 455 460 

Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly He Ala Arg Ala 
465 470 ' 475 480 

He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser Asp Leu Ser Ala 
485 490 495 

Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr Phe Val Ala Asp 
500 505 510 

Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu Ser Glu Trp Met 
515 520 525 

Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
530 535 540 

<210> 7 
<211> 1692 
<212> ADN 

<213> Pseudomonas acidovorans 

<220> 

<221> CDS 

<222> (1) . . (1692) 

<400> 7 

atg tec cac ccc gec ate tec ctg caa gcg ctg cgc ggc age ggc gca 48 
Met Ser His Pro Ala lie Ser Leu Gin Ala Leu Arg Gly Ser Gly Ala 
15 10 15 

gac ata cag tec ate cac ate ccc tac gag cgc cat gec gac cag gac 96 
Asp He Gin Ser He His He Pro Tyr Glu Arg His Ala Asp Gin Asp 
20 25 30 

gec ggt gcg gac acg ccc gec egg cat ccc gtc gtc ate gtc ggc gee 144 
Ala Gly Ala Asp Thr Pro Ala Arg His Pro Val Val He Val Gly Ala 
35 40 45 

ggc ccc gtg ggc ctg teg ctg gee ate gac ctg gee cag cgc ggc cag 192 
Gly Pro Val Gly Leu Ser Leu Ala He Asp Leu Ala Gin Arg Gly Gin 
50 55 60 

cgc gtg gtg ctg ctg gac aac gac tgc egg ctg tec acg ggc teg cgc 240 
Arg Val Val Leu Leu Asp Asn Asp Cys Arg Leu Ser Thr Gly Ser Arg 
65 70 75 80 

gec ate tgc ttt tec aag cgc acg ctg gag ate tgg gac cgc ctg ggc 288 
Ala He Cys Phe Ser Lys Arg Thr Leu Glu He Trp Asp Arg Leu Gly 
85 90 95 

gtg ggc cag ccc atg gtg gac aag ggc gtg tec tgg aac ctg ggc aag 336 
Val Gly Gin Pro Met Val Asp Lys Gly Val Ser Trp Asn Leu Gly Lys 
100 105 110 

gtc ttc ttc aag gac cag ccg ctg tac cgc ttc gac ctg ctg ccc gag 384 
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Val Phe Phe Lys Asp Gin Pro Leu Tyr Arg Phe Asp Leu Leu Pro Glu 

115 120 125 

gac ggc cac gag cgc ccg gcc ttc ate aac ctg cag cag tac tac gec 432 

Asp Gly His Glu Arg Pro Ala Phe lie Asn Leu Gin Gin Tyr Tyr Ala 

130 , 135 140 

gag gcc tat ctg gtc gag cgc gca ctg cag ctg ccg ctg ate gac ctg 480 

Glu Ala Tyr Leu Val Glu Arg Ala Leu Gin Leu Pro Leu lie Asp Leu 

145 150 ~ 155 160 

cgc tgg cac age aag gtc acg gca ctg gag ccg cag gcc gag ggc gcg 528 

Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gin Ala Glu Gly Ala 

165 170 175 

ctg ctg acc gtg gag acg cct gac ggc age tac cgc ate gat gcg caa 576 

Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg lie Asp Ala Gin 

180 185 " " 190 

tgg gtc ctg gcc tgc gat ggc teg cgc teg ccg ctg cgc ggc ctg ctg 624 

Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly Leu Leu 

195 200 205 

ggc cag gaa age cat ggc cgc ate ttc cgc gac cgc ttc ctg ate gcc 672 

Gly Gin Glu Ser His Gly Arg lie Phe Arg Asp Arg Phe Leu lie Ala 

210 215 220 

gac gtg aag atg cac gcc gaa ttc ccc acc gag cgc tgg ttc tgg ttc 720 

Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe Trp Phe 
225 230 235 240 

gac ccg ccc ttc cac ccg ggc cag age gtg ctg ctg cac cgc cag ccc 768 

Asp Pro Pro Phe His Pro Gly Gin Ser Val Leu Leu His Arg Gin Pro 

245 250 255 

gac gat gtc tgg cgc ate gac ttc cag ctg ggc tgg gac gcg gac ccc 816 

Asp Asp Val Trp Arg lie Asp Phe Gin Leu Gly Trp Asp Ala Asp Pro 

260 265 270 

gag gaa gag aaa aag ccc gag aac ate gtg ccg cgc ate cgc gcc ctg 864 

Glu Glu Glu Lys Lys Pro Glu Asn lie Val Pro Arg He Arg Ala Leu 

275 280 285 

ctg ggc aag gac gcg ccc ttc gag ctg gaa tgg gcc age gtc tac acc 912 

Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val Tyr Thr 

290 295 300 

ttc gcc tgc ctg cgc atg gac cgc ttc gtc cat ggc cgc gtg gtc ttt 960 

Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val Val Phe 
305 310 315 320 

gcg ggc gac age gcc cac ggc gtc teg ccg ttt ggc gca cgc ggc gcc 1008 

Ala Gly Asp Ser Ala His Gly Val Ser Pro Phe Gly Ala Arg Gly Ala 

325 330 ~ 335 

aac age ggc gtg cag gat gcc gag aac ctg gca tgg aag ctg gac cgc 1056 

Asn Ser Gly Val Gin Asp Ala Glu Asn Leu Ala Trp Lys Leu Asp Arg 

340 345 350 

gtg ctg cgc ggc cag gcc gat gcc teg ctg ate gcc acc tac ggc gcc 1104 

Val Leu Arg Gly Gin Ala Asp Ala Ser Leu He Ala Thr Tyr Gly Ala 

355 360 365 

gag cgc gaa tac gcg gcc gac gag aac ate cgc aac tec acg cgc gcc 1152 

Glu Arg Glu Tyr Ala Ala Asp Glu Asn He Arg Asn Ser Thr Arg Ala 

370 375 380 

acc gac ttc ate acg ccc aag age gag ate age cgc ctg ttt cgc gac 1200 
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Thr Asp Phe He Thr Pro Lys Ser Glu He Ser Arg Leu Phe Arg Asp 
385 390 395 400 

gcc gtg ctg gac ctg gcg cgc gac cat gaa ttc gcg cgc cgc ate gtc 124 8 
Ala Val Leu Asp Leu Ala Arg Asp His Glu Phe Ala Arg Arg He Val 
405 410 415 

aac age ggg egg ctg tec gtg ccg gcc acg ctg cac ggc tec gcg etc 1296 
Asn Ser Gly Arg Leu Ser Val Pro Ala Thr Leu His Gly Ser Ala Leu 
420 425 430 

aac acg cct gac ace gac acc ttc gac gga acg cag ctg ccc ggc gcc 1344 
Asn Thr Pro Asp Thr Asp Thr Phe Asp Gly Thr Gin Leu Pro Gly Ala 
435 440 445 

gtg ctg gcc gat gcg ccc atg cgc egg ccc ggc gca gac ggc acg gcc 1392 
Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp Gly Thr Ala 
450 455 460 

tgg ctg ctg cgc gca ctg gga ccg gac ttc acg ctg ctg cac ttc gac 1440 
Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Thr Leu Leu His Phe Asp 
465 470 475 480 

ccc acg ccc gcc tgg gcg cag gcg ctg ccc ggc gtg etc aac ctg tec 14 88 
Pro Thr Pro Ala Trp Ala Gin Ala Leu Pro Gly Val Leu Asn Leu Ser 
485 490 495 

ate gcg gcc gag ggc gag gcc cat gcg cca gac gcc gac etc ate gat 1536 
He Ala Ala Glu Gly Glu Ala His Ala Pro Asp Ala Asp Leu He Asp 
500 505 510 

gcg cgc ggc ctg gcg gcc aaa cgc ctg gat gca cgc ccc ggc acc age 1584 
Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly Thr Ser 
515 520 525 

tac ctg ctg egg cct gac cag cat gtc tgc gcg cgc tgg cgc cgc ccc 1632 
Tyr Leu Leu Arg Pro Asp Gin His Val Cys Ala Arg Trp Arg Arg Pro 
530 535 540 

gac gaa gcc age gtg cgc gcc gcg ctg caa aga gcc tgc ggc gcc gcc 1680 
Asp Glu Ala Ser Val Arg Ala Ala Leu Gin Arg Ala Cys Gly Ala Ala 
545 550 555 560 



<210> 8 
<211> 564 
<212> 

<213> Pseudomonas acidovorans 
<400> 8 

Met Ser His Pro Ala He Ser Leu Gin Ala Leu Arg Gly Ser Gly Ala 
15 10 15 

Asp He Gin Ser He His He Pro Tyr Glu Arg His Ala Asp Gin Asp 
20 25 30 

Ala Gly Ala Asp Thr Pro Ala Arg His Pro Val Val He Val Gly Ala 
35 40 45 

Gly Pro Val Gly Leu Ser Leu Ala He Asp Leu Ala Gin Arg Gly Gin 
50 55 60 

Arg Val Val Leu Leu Asp Asn Asp Cys Arg Leu Ser Thr Gly Ser Arg 
65 70 75 " 80 
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Ala lie Cys Phe Ser Lys Arg 
85 

• Met Val Asp 
: Asp Gin Pro 



Val Gly Gin Pro 1 
100 



Val Phe Phe Lys ; 
115 



Asp Gly His Glu 
130 



Glu Ala Tyr Leu 
145 



Arg Pro Ala 
135 



Val Glu Arg 
150 



Arg Trp His Ser Lys Val Thr 
165 



Leu Leu Thr Val 
180 



Trp Val Leu Ala 
195 



Gly Gin Glu Ser 
210 



Asp Val Lys Met 
225 



Glu Thr Pro 
Cys Asp Gly 



His Gly Arg 
215 



His Ala Glu 
230 



Thr Leu Glu 
90 



Lys Gly Val 
105 



Leu Tyr Arg 
120 



Phe lie Asn 
Ala Leu Gin 



Ala Leu Glu 
170 



Asp Gly Ser 
185 



Ser Arg Ser 
200 



lie Phe Arg 
Phe Pro Thr 



lie Trp Asp 
Ser Trp Asn 



Leu Gly Lys 
110 



Phe Asp Leu Leu Pro Glu 
125 



Leu Gin Gin ' 
140 



Leu Pro Leu 
155 



Pro Gin Ala 
Tyr Arg lie 



Pro Leu Arg 
205 



Asp Arg Phe 
220 



Glu Arg Trp 
235 



Asp Pro Pro Phe His Pro Gly 
245 



Asp Asp Val Trp 
260 



Glu Glu Glu Lys 
275 



Leu Gly Lys Asp 
290 



Phe Ala Cys Leu 
305 



Arg lie Asp 
Lys Pro Glu 



Gin Ser Val Leu Leu His 
250 



Phe Gin Leu Gly Trp Asp 
265 



Asn lie Val 
280 



Ala Pro Phe Glu Leu Glu 
295 



Pro Arg lie 
285 



Trp Ala Ser 
300 



Arg Met Asp i 
310 



His Gly Arg 
315 



Ala Gly Asp Ser Ala His Gly 
325 



Val Ser Pro 
330 



Asn Ser Gly Val 
340 



Val Leu Arg Gly 
355 



Glu Arg Glu Tyr 
370 



Thr Asp Phe lie 
385 



Gin Asp Ala 

Gin Ala Asp 

Ala Ala Asp 
375 



Glu Asn Leu 
345 



Ala Ser Leu 
360 

Glu Asn lie 



Thr Pro Lys Ser Glu lie 
390 



Ala Val Leu Asp Leu Ala Arg 
405 



Asn Ser Gly Arg Leu Ser Val 
420 



Asp His Glu 
410 



Pro Ala Thr 
425 



Phe Gly Ala 
Ala Trp Lys 



He Ala Thr 
365 



Arg Asn Ser 
380 



Ser Arg Leu 
395 



Phe Ala Arg 
Leu His Gly 



He Asp Leu 
160 



Glu Gly Ala 
175 



Asp Ala Gin 
190 



Gly Leu Leu 
Leu He Ala 



Phe Trp Phe 
240 



Arg Gin Pro 
255 



Ala Asp Pro 
270 



Arg Ala Leu 
Val Tyr Thr 



Val Val Phe 
320 



Arg Gly Ala 
335 



Leu Asp Arg 
350 



Tyr Gly Ala 
Thr Arg Ala 



Phe Arg Asp 
400 



Arg He Val 
415 



Ser Ala Leu 
430 



Asn Thr Pro Asp ' 
435 



Phe Asp Gly 
440 



Thr Gin Leu Pro Gly Ala 
445 
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Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp Gly Thr Ala 
450 455 460 

Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Thr Leu Leu His Phe Asp 
465 470 475 480 

Pro Thr Pro Ala Trp Ala Gin Ala Leu Pro Gly Val Leu Asn Leu Ser 
485 490 495 

lie Ala Ala Glu Gly Glu Ala His Ala Pro Asp Ala Asp Leu lie Asp 
500 505 510 

Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly Thr Ser 
515 520 525 

Tyr Leu Leu Arg Pro Asp Gin His Val Cys Ala Arg Trp Arg Arg Pro 
530 535 540 

Asp Glu Ala Ser Val Arg Ala Ala Leu Gin Arg Ala Cys Gly Ala Ala 
545 550 555 560 

Ala Thr Ala 

<210> 9 
<211> 966 
<212> ADN 

<213> Pseudomonas acidovorans 

<220> 

<221> CDS 

<222> (1) . . (966) 

<400> 9 

atg acc acc aag acc ttt gcc tec gec gec gac etc gaa ate aag cag 48 

Met Thr Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu lie Lys Gin 
15 10 15 

gtc age ttc gac aag etc tec gag cac gcc tat gcc tac acg gcc gaa 96 
Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

ggc gac ccc aac acc ggc ate ate att ggc gac gac gcg gtg atg gtg 144 
Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp Ala Val Met Val 
35 40 45 

ate gac acc cag gcc acg ccc gtc atg gcc cag gac gtg ate cgc cgc 192 
He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Arg 
50 55 60 

ate cgt gag gtc acg gac aag ccc ate aag tac gtg acg ctg teg cac 240 
He Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 
65 70 75 80 

tac cac gcg gtg cgc gtg ctg ggc gcc teg gcc ttc ttc gcg gaa ggc 288 
Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 95 

gcc gaa cac ate att gcc age cag gac acc tac gac etc ate gtg gag 336 
Ala Glu His He He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 HO 

cgc ggc gag cag gac aag gcc age gag ate ggc cgc ttt ccc cgc ctg 384 
Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

ttc cag aac gtg gaa age gtg ccc gat ggc atg acc tgg ccc acc etc 432 
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Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 

130 135 ~ 140 

acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 480 

Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 

145 150 155 160 

ate ctg cag ctg ggc cgc ggc cac acc aag ggc gac acc gtg gtc tgg 528 

lie Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 

165 170 * 175 

ctg ccc cag gac aag gtg ctg ttc age ggc gac ctg gtg gag ttc ggc 576 

Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 

180 185 190 

gec acg ccc tat gcg ggc gat gec tac ttc cag gac tgg ccg cac acg 624 

Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 

195 200 205 

ctg gac gec ate gec gec ctg cag ccc gaa aag etc gtg ccc ggc egg 672 

Leu Asp Ala lie Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 

210 215 220 

ggc gec gcg ctg cag acg ccg gec gag gtg cag gec ggc ctg gec ggc 720 

Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 

225 230 235 240 

acg cgc gac ttc ate age gac ctg tgg acc gag gtc aag gec ggc gec 768 

Thr Arg Asp Phe lie Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 

245 250 255 

gat gec cag cag gac ctg cgc aag gtc tac gag gec gee ttc gee aag 816 

Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 

260 265 270 

ctg cag ccc aag tac ggc cag tgg gtg ate ttc aac cac tgc atg ccc 864 

Leu Gin Pro Lys Tyr Gly Gin Trp Val lie Phe Asn His Cys Met Pro 

275 280 285 

ttc gat gtg acc cgc gec tat gac gag gca teg ggc cac gec gac cca 912 

Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 

290 295 300 

cgc ate tgg acc gec gag cgc gac cgc cag atg tgg ctg gcg etc gaa 960 

Arg lie Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 

305 310 315 320 

ggc tga 966 
Gly 



<210> 10 
<211> 322 
<212> 

<213> Pseudomonas acidovorans 
<400> 10 

Met Thr Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu lie Lys Gin 
15 10 15 

Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp Ala Val Met Val 
35 40 45 

He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Arg 
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He Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 
65 70 75 80 

Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 95 

Ala Glu His He He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 110 

Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 140 

Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
145 150 155 160 

He Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
165 170 175 

Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 185 190 

Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

Leu Asp Ala He Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
210 215 220 

Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
225 230 235 240 

Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 
245 250 255 

Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 

Leu Gin Pro Lys Tyr Gly Gin Trp Val lie Phe Asn His Cys Met Pro 
275 280 285 

Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 
290 295 300 

Arg He Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 
305 310 315 320 



<210> 11 
<211> 966 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 
d'HPAC de P. acidovorans 

<220> 

<221> CDS 

<222> (1) . . (966) 

<400> 11 

atg tec acc aag acc ttt gec tec gec gec gac etc gaa ate aag cag 48 
Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu He Lys Gin 
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gtc age ttc gac aag etc tec gag cac gec tat gec tac acg gec gaa 
Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

ggc gac ccc aac acc ggc ate ate att ggc gac gac geg gtg atg gtg 
Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp Ala Val Met Val 
35 40 45 

ate gac acc cag gec acg ccc gtc atg gec cag gac gtg ate cgc cgc 
He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Arg 



ate cgt gag gtc acg gac aag ccc ate aag tac gtg acg ctg teg cac 
He Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 



tac cac geg gtg cgc gtg ctg ggc gee teg gec ttc ttc gcg gaa ggc 
Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 95 

gec gaa cac ate att gec age cag gac acc tac gac etc ate gtg gag 
Ala Glu His He He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 110 

cgc ggc gag cag gac aag gee age gag ate ggc cgc ttt ccc cgc ctg 
Arg Gly Glu Gin Asp Lys Ala Ser Glu lie Gly Arg Phe Pro Arg Leu 
115 120 125 

ttc cag aac gtg gaa age gtg ccc gat ggc atg acc tgg ccc acc etc 
Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 140 

acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 
Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
145 150 155 160 

ate ctg cag ctg ggc cgc ggc cac acc aag ggc gac acc gtg gtc tgg 
lie Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
165 170 175 

ctg ccc cag gac aag gtg ctg ttc age ggc gac ctg gtg gag ttc ggc 
Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 185 190 

gec acg ccc tat gcg ggc gat gec tac ttc cag gac tgg ccg cac acg 
Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

ctg gac acc ate gec gee ctg cag ccc gaa aag etc gtg ccc ggc egg 
Leu Asp Thr He Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
210 215 220 

ggc gec gcg ctg cag acg ccg gec gag gtg cag gee ggc ctg gec ggc 
Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
225 230 235 240 

acg cgc gac ttc ate age gac ctg tgg acc gag gtc aag gee ggc gee 
Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 
245 250 255 

gat gec cag cag gac ctg cgc aag gtc tac gag gec gec ttc gee aag 
Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 

ctg cag ccc aag tac ggc cag tgg gtg ate ttc aac cac tgc atg ccc 
Leu Gin Pro Lys Tyr Gly Gin Trp Val He Phe Asn His Cys Met Pro 
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275 



280 



285 



ttc gat gtg acc cgc gcc tat gac gag gca teg ggc cac gec gac cca 912 
Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 



cgc ate tgg acc gcc gag cgc gac cgc cag atg tgg ctg gcg etc gaa 960 
Arg lie Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 
305 310 315 320 

ggc tga 966 
Gly 



<210> 12 
<211> 322 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: mutant 
d'HPAC de P. acidovorans 

<400> 12 

Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu lie Lys Gin 
15 10 15 

Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp Ala Val Met Val 
35 40 45 

He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Arg 
50 55 60 

He Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 
65 70 75 80 

Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 95 

Ala Glu His He He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 110 

Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 140 

Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
145 150 155 160 

He Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
165 170 175 

Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 185 190 

Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

Leu Asp Thr He Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arq 
210 215 220 

Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
225 230 235 240 

Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 



290 



295 



300 
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Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 " ' 265 270 

Leu Gin Pro Lys Tyr Gly Gin Trp Val lie Phe Asn His Cys Met Pro 
275 * " 280 285 

Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 
290 295 300 

Arg lie Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 
305 310 315 320 



<210> 13 
<211> 966 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: mutant 
d'HPAC de P. acidovorans 

<220> 

<221> CDS 

<222> (1) . . (966) 

<400> 13 

atg tec acc aag acc ttt gec tec gec gec gac etc gaa ate aag cag 

Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu lie Lys Gin 
15 10 15 

gtc age ttc gac aag etc tec gag cac gec tat gec tac acg gee gaa 
Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 30 

ggc gac ccc aac acc ggc ate ate att ggc gac gac gcg gtg atg gtg 
Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp Ala Val Met Val 
35 40 45 

ate gac acc cag gec acg ccc gtc atg gee cag gac gtg ate cgc cgc 
He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Arg 



ate cgt gag gtc acg gac aag ccc ate aag tac gtg acg ctg teg cac 
He Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 
65 70 75 80 

tac cac gcg gtg cgc gtg ctg ggc gec teg gec ttc ttc gcg gaa ggc 
Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 95 

gee gaa cac ate att gec age cag gac acc tac gac etc ate gtg gag 
Ala Glu His lie lie Ala Ser Gin Asp Thr Tyr Asp Leu lie Val Glu 
100 105 110 

cgc ggc gag cag gac aag gec age gag ate ggc cgc ttt ccc cgc ctg 
Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

ttc cag aac gtg gaa age gtg ccc gat ggc atg acc tgg ccc acc etc 
Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 140 

acc ttc acc ggc aag atg acg ctg tgg ctg ggc aag ctg gaa gtg cag 
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Thr 
145 


Phe 


Thr 


Gly Lys Met 
150 


Thr 


Leu 


Trp 


Leu 


Gly 
155 


Lys 


Leu 


Glu 


Val Gin 
160 




ate 
He 


ctg 
Leu 


cag 
Gin 


ctg ggc cgc 
Leu Gly Arg 
165 


ggc 
Gly 


cac 
His 


acc 
Thr 


aag 
Lys 
170 


ggc 
Gly 


gac 
Asp 


acc 
Thr 


gtg 
Val 


gtc tgg 
Val Trp 
175 


528 


ctg 
Leu 


ccc 
Pro 


cag 
Gin 


gac aag gtg 
Asp Lys Val 
180 


ctg 
Leu 


ttc 
Phe 


age 
Ser 
185 


ggc 

Gly 


gac 
Asp 


ctg 
Leu 


gtg 
Val 


gag 
Glu 
190 


ttc ggc 
Phe Gly 


576 


gec 
Ala 


acg 
Thr 


ccc 
Pro 
195 


tat gcg ggc 
Tyr Ala Gly 


gat 
Asp 


gee 
Ala 
200 


tac 
Tyr 


ttc 
Phe 


cag 
Gin 


gac 
Asp 


tgg 
Trp 
205 


ccg 
Pro 


cac acg 
His Thr 


624 


ctg 
Leu 


gac 
Asp 
210 


gec 
Ala 


ate gee gec 
He Ala Ala 


ctg 
Leu 
215 


cag 
Gin 


ccc 
Pro 


gaa 
Glu 


aag 
Lys 


etc 
Leu 
220 


gtg 
Val 


ccc 
Pro 


ggc egg 
Gly Arg 


672 


ggc 
Gly 
225 


gec 
Ala 


gcg 
Ala 


ctg cag acg 
Leu Gin Thr 
230 


ccg 
Pro 


gec 
Ala 


gag 
Glu 


gtg 
Val 


cag 
Gin 
235 


gee 
Ala 


ggc 
Gly 


ctg 
Leu 


gee ggc 
Ala Gly 
240 


720 


acg 
Thr 


cgc 
Arg 


gac 
Asp 


ttc ate age 
Phe He Ser 
245 


gac 
Asp 


ctg 
Leu 


tgg 
Trp 


acc 
Thr 
250 


gag 
Glu 


gtc 
Val 


aag 
Lys 


gec 
Ala 


ggc gec 
Gly Ala 
255 


768 


gat 
Asp 


gec 
Ala 


cag 
Gin 


cag gac ctg 
Gin Asp Leu 
260 


cgc 
Arg 


aag 
Lys 


gtc 
Val 
265 


tac 
Tyr 


gag 
Glu 


gee 
Ala 


gec 
Ala 


ttc 
Phe 
270 


gee aag 
Ala Lys 


816 


ctg 
Leu 


cag 
Gin 


ccc 
Pro 
275 


aag tac ggc 
Lys Tyr Gly 


cag 
Gin 


tgg 

Trp 
280 


gtg 
Val 


ate 
He 


ttc 
Phe 


aac 
Asn 


cac 
His 
285 


tgc 
Cys 


atg ccc 
Met Pro 


864 


ttc 

Phe 


gat 
Asp 
290 


gtg 
Val 


acc cgc gec 
Thr Arg Ala 


tat 
Tyr 
295 


gac 
Asp 


gag 
Glu 


gca 
Ala 


teg 
Ser 


ggc 
Gly 
300 


cac 
His 


gec 
Ala 


gac cca 
Asp Pro 


912 


cgc 
Arg 
305 


ate 
He 


tgg 
Trp 


acc gee gag 
Thr Ala Glu 
310 


cgc 
Arg 


gac 
Asp 


cgc 
Arg 


cag 
Gin 


atg 
Met 
315 


tgg 
Trp 


ctg 
Leu 


gcg 
Ala 


etc gaa 
Leu Glu 
320 


960 



ggc tga 
Gly 



<210> 14 
<211> 322 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: mutant 
d'HPAC de P. acidovorans 

<400> 14 

Met Ser Thr Lys Thr Phe Ala Ser Ala Ala Asp Leu Glu He Lys Gin 
15 10 15 

Val Ser Phe Asp Lys Leu Ser Glu His Ala Tyr Ala Tyr Thr Ala Glu 
20 25 " 30 

Gly Asp Pro Asn Thr Gly He He He Gly Asp Asp Ala Val Met Val 
35 40 45 

He Asp Thr Gin Ala Thr Pro Val Met Ala Gin Asp Val He Arg Arg 
50 55 60 

He Arg Glu Val Thr Asp Lys Pro He Lys Tyr Val Thr Leu Ser His 
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Tyr His Ala Val Arg Val Leu Gly Ala Ser Ala Phe Phe Ala Glu Gly 
85 90 95 

Ala Glu His He He Ala Ser Gin Asp Thr Tyr Asp Leu He Val Glu 
100 105 110 

Arg Gly Glu Gin Asp Lys Ala Ser Glu He Gly Arg Phe Pro Arg Leu 
115 120 125 

Phe Gin Asn Val Glu Ser Val Pro Asp Gly Met Thr Trp Pro Thr Leu 
130 135 " * 140 

Thr Phe Thr Gly Lys Met Thr Leu Trp Leu Gly Lys Leu Glu Val Gin 
145 150 155 160 

He Leu Gin Leu Gly Arg Gly His Thr Lys Gly Asp Thr Val Val Trp 
165 170 175 

Leu Pro Gin Asp Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly 
180 185 190 

Ala Thr Pro Tyr Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr 
195 200 205 

Leu Asp Ala He Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg 
210 215 220 

Gly Ala Ala Leu Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly 
225 230 235 240 

Thr Arg Asp Phe He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala 
245 250 255 

Asp Ala Gin Gin Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys 
260 265 270 

Leu Gin Pro Lys Tyr Gly Gin Trp Val He Phe Asn His Cys Met Pro 
275 280 285 

Phe Asp Val Thr Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro 
290 295 300 

Arg He Trp Thr Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu 
305 310 315 320 



<210> 15 
<211> 3549 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: cassette 
d' expression 

<220> 

<221> promoter 
<222> (1) . . (928) 

<220> 
<221> CDS 

<222> (965) . . [2647) 



<220> 
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<221> terminator 
<222> (2811) . . (3549) 

<400> 15 



tgcatgccta 


ggtcgaggag 


aaatatgagt 


cgaggcatgg 


atacactaag 


ttcccctgaa 


60 


gtgagcatga 


tetttgatge 


tgagatgatt 


cccagagcaa 


gatagtttgt 


getgeaagtg 


120 


acacaattgt 


aatgaaacca 


ccactcaacg 


aatttacttg 


tggctttgac 


atgtcgtgtg 


180 


ctctgtttgt 


atttgtgagt 


gccggttggt 


aattattttt 


gttaatgtga 


ttttaaaacc 


240 


tcttatgtaa 


atagttactt 


tatctattga 


agtgtgttct 


tgtggtctat 


agtttctcaa 


300 


agggaaatta 


aaatgttgac 


atcccattta 


caattgataa 


cttggtatac 


acaaactttg 


360 


taaatttggt 


gatatttatg 


gtcgaaagaa 


ggcaataccc 


attgtatgtt 


ccaatatcaa 


420 


tatcaatacg 


ataacttgat 


aatactaaca 


tatgattgtc 


attgtttttc 


cagtatcaat 


480 


atacattaag 


ctactacaaa 


attagtataa 


atcactatat 


tataaatctt 


tttcggttgt 


540 


aacttgtaat 


tcgtgggttt 


ttaaaataaa 


agcatgtgaa 


aattttcaaa 


taatgtgatg 


600 


gcgcaatttt 


attttccgag 


ttccaaaata 


ttgccgcttc 


attaccctaa 


tttgtggcgc 


660 


cacatgtaaa 


acaaaagacg 


attcttagtg 


gctatcactg 


ccatcacgcg 


gatcactaat 


720 


atgaaccgtc 


gattaaaaca 


gatcgaeggt 


ttatacatca 


ttttattgta 


cacacggatc 


780 


gatatctcag 


ccgttagatt 


taatatgega 


tetgattget 


caaaaaatag 


actctccgtc 


840 


tttgcctata 


aaaacaattt 


cacatctttc 


tcacccaaat 


ctactcttaa 


ccgttcttct 


900 


tcttctacag 


acatcaattt 


ctctcgactc 


tagaggatcc 


aagcttatcg 


atttcgaacc 


960 


cctc atg act tea ctt aca gtg tec 
Met Thr Ser Leu Thr Val Ser 


ggc egg gtg gcg cag gtc etc age 
Gly Arg Val Ala Gin Val Leu Ser 


1009 



1 5 10 15 



age tat gtc age gat gtg ttc ggt gtg atg ggc aac gga aac gtc tac 1057 
Ser Tyr Val Ser Asp Val Phe Gly Val Met Gly Asn Gly Asn Val Tyr 
20 25 30 

ttc ctg gac gec gee gag aag gag ggc etc cgc ttc acg gee gta cgc 1105 
Phe Leu Asp Ala Ala Glu Lys Glu Gly Leu Arg Phe Thr Ala Val Arg 
35 40 45 

cat gaa ggt gee gee ate gcg gcg gcg gac gee tac tat egg gca tec 1153 
His Glu Gly Ala Ala lie Ala Ala Ala Asp Ala Tyr Tyr Arg Ala Ser 
50 55 60 

ggg cgc ctg gcg gcg ggg acc ace ace tac ggc ccc ggt tac acc aac 1201 
Gly Arg Leu Ala Ala Gly Thr Thr Thr Tyr Gly Pro Gly Tyr Thr Asn 
65 70 75 

gee ctg acg gec etc gee gag gcg gtc cag gcg cag ate ccc gtg gtg 124 9 
Ala Leu Thr Ala Leu Ala Glu Ala Val Gin Ala Gin lie Pro Val Val 
80 85 90 95 

etc gtc acc ggg gac gec ccg age age ggc gee egg cct tgg gac gtg 1297 
Leu Val Thr Gly Asp Ala Pro Ser Ser Gly Ala Arg Pro Trp Asp Val 
100 105 110 

gac cag gec gcg ate gec gee ggg ctg ggg gcg gcg acc ttc acg gtc 1345 
Asp Gin Ala Ala He Ala Ala Gly Leu Gly Ala Ala Thr Phe Thr Val 
115 120 125 
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acc cgt gaa gcc gca ggc tec ate acg cag gaa gcg gtg gag tac gca 1393 
Thr Arg Glu Ala Ala Gly Ser He Thr Gin Glu Ala Val Glu Tyr Ala 
130 135 140 

ctt gcc egg egg acc gcc gtc gtg ate gcc gtt cca tac gac ctg teg 1441 
Leu Ala Arg Arg Thr Ala Val Val He Ala Val Pro Tyr Asp Leu Ser 
145 150 155 

gcc ctt gag gcg gcg gag gaa gat ctt ccc gtg ccg ccg gcg gcc teg 14 8 9 
Ala Leu Glu Ala Ala Glu Glu Asp Leu Pro Val Pro Pro Ala Ala Ser 
160 165 170 175 

gtt ccg gac gcc ate ggc ggc gga etc gga egg gcg gcc gaa gtg egg 1537 
Val Pro Asp Ala He Gly Gly Gly Leu Gly Arg Ala Ala Glu Val Arg 
180 185 190 

gcg gcc gaa ttg ctg gcg ggc gcg aag egg ccg etc ate ctt gcc ggc 1585 
Ala Ala Glu Leu Leu Ala Gly Ala Lys Arg Pro Leu He Leu Ala Gly 
195 200 205 

cgc ggt gcg cac etc gca gga acc ggc ccc gaa etc egg gaa etc gcc 1633 
Arg Gly Ala His Leu Ala Gly Thr Gly Pro Glu Leu Arg Glu Leu Ala 
210 215 220 

gac cgc etc ggc gcg etc acg gcc ggc acc gca ctg gcg ctg aac ctg 1681 
Asp Arg Leu Gly Ala Leu Thr Ala Gly Thr Ala Leu Ala Leu Asn Leu 
225 230 235 

ctg cag ggc gag ggg tac etc ggc gtc gcg ggc ggc ttc ggc acg gat 172 9 
Leu Gin Gly Glu Gly Tyr Leu Gly Val Ala Gly Gly Phe Gly Thr Asp 
240 245 250 255 

acc gcc gcc ggg etc atg ggc gag gcg gac gtg gtg etc gtg gcg gga 1777 
Thr Ala Ala Gly Leu Met Gly Glu Ala Asp Val Val Leu Val Ala Gly 
260 265 270 

gcc age ctg acc ccc ttc acc atg cgc ttc ggc cac ctg ate ggc ccg 1825 
Ala Ser Leu Thr Pro Phe Thr Met Arg Phe Gly His Leu He Gly Pro 
275 280 285 

gac gcc acc gtg ate cag ate gac acc gcc atg gag ccg acg gac ccg 1873 
Asp Ala Thr Val He Gin He Asp Thr Ala Met Glu Pro Thr Asp Pro 
290 295 300 

egg gtg gac ctg ttt gtc agt gcg gac gcg aag gcc get gcc ggc egg 1921 
Arg Val Asp Leu Phe Val Ser Ala Asp Ala Lys Ala Ala Ala Gly Arg 
305 310 315 

ate etc egg ctg ctg gat gac gcc gcc ggg gcc aat gcg teg aag gcc 1969 
He Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala 
320 325 330 335 

tgg cgc gcg gaa gca etc aag cgt ctg gcc gaa gga ccc tgc cac cac 2017 
Trp Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His 
340 345 350 

ccc ggc acc gca gag acc acg gac ggc cgc ctt gac ccc egg gcg ctt 2065 
Pro Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu 
355 360 365 

get teg gca ctg gat gcc gtc ctg ccg gaa cgc cgc acc gtg gtc cag 2113 
Ala Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin 
370 375 380 

gac ggc ggg cac ttc ctg ggc tgg gca ccc atg tac tgg cgc ate ccc 2161 
Asp Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg He Pro 
385 390 395 
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cgt cct cag gac ctg gtc atg gtg ggg acc gcg tac cag teg ate ggg 2209 

Arg Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly 
400 405 410 415 

ctt ggc ctg gec age gec gtg ggg gcg tec egg gee gtg gac gac ggc 2257 

Leu Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly 
420 425 430 

aat ate ctg gtg ctg gcg gcg ggc gac ggc gga ttc ctg atg ggc ctg 2305 

Asn He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu 
435 440 " ' 445 

tec gac ctg gaa teg etc gtg ggc gcg gcg age age gee gtc gtg gtg 2353 

Ser Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val 
450 455 460 

ate tac aac gac gee gee tac ggg gee gag ate cat cag tac ggc tea 24 01 

He Tyr Asn Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser 

465 470 475 

egg ggg etc acc gaa aag ccc atg ctg ate ccc gaa gtg gac ttc age 2449 

Arg Gly Leu Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe Ser 
480 485 490 495 

ggg att gec cgc gcg ate ggg gcg gaa tec gca ate ate cgc aag ctg 24 97 

Gly He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu 
500 505 510 

teg gac etc tec gcg etc acg gac tgg ate gag gec ggc gec agg gga 2545 

Ser Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly 
515 520 525 

acc ttc gtg gec gac tgc cgc ate acc tea age gtc egg gec ccg tgg 2593 

Thr Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp 
530 535 540 

ctg age gaa tgg atg agg gec teg caa gcg gcg aag gag gcg gtg gcg 2641 

Leu Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala 

545 550 555 

ggc tag ggccggcctc gtcgaaatgc cgccctccaa cccaactcag taccagctca 2697 

Gly 

560 

gggcgttctc agggctggga acgccctgag ctgctactca tttgttcgaa ctcgaggtcg 2757 

aeggtatega taagcttgat atcgaattcc tgcagcccgg gggatccact aggggatccc 2817 

ccgatccgcg tttgtgtttt ctgggtttct cacttaagcg tctgcgtttt acttttgtat 2877 

tgggtttggc gtttagtagt ttgeggtage gttcttgtta tgtgtaatta egctttttet 2937 

tettgettea geagtttegg ttgaaatata aatcgaatca agtttcactt tatcagegtt 2997 

gttttaaatt ttggcattaa attggtgaaa attgettcaa ttttgtatct aaatagaaga 3057 

gacaacatga aattcgactt ttgacctcaa atcttcgaac atttatttcc tgatttcacg 3117 

atggatgagg ataacgaaag ggcggttcct atgtccggga aagttcccgt agaagacaat 3177 

gagcaaagct actgaaaege ggacacgacg tcgcattggt aeggatatga gttaaaccga 3237 

ctcaattcct ttattaagac ataaaccgat tttggttaaa gtgtaacagt gagctgatat 3297 

aaaaccgaaa caaaceggta caagtttgat tgagcaactt gatgacaaac ttcagaattt 3357 

tggttattga atgaaaatca tagtctaatc gtaaaaaatg tacagaagaa aagctagagc 3417 
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agaacaaaga ttctatattc tggttccaat ttatcatcgc tttaacgtcc ctcagatttg 3477 
atcgggctgc aggaattcgg cctgactgat catttaaaca ctagttctag agcggccgcc 3537 
accgcggtgg ag 3549 

<210> 16 
<211> 241 
<212> 

<213> Sequence artif icielle 

<223> Description de la sequence artif icielle : cassette 
d' expression 

<400> 16 

Leu Arg Leu Leu Asp Asp Ala Ala Gly Ala Asn Ala Ser Lys Ala Trp 
1 5 10 15 

Arg Ala Glu Ala Leu Lys Arg Leu Ala Glu Gly Pro Cys His His Pro 
20 25 30 

Gly Thr Ala Glu Thr Thr Asp Gly Arg Leu Asp Pro Arg Ala Leu Ala 
35 40 45 

Ser Ala Leu Asp Ala Val Leu Pro Glu Arg Arg Thr Val Val Gin Asp 
50 55 60 

Gly Gly His Phe Leu Gly Trp Ala Pro Met Tyr Trp Arg lie Pro Arg 
65 70 75 " 80 

Pro Gin Asp Leu Val Met Val Gly Thr Ala Tyr Gin Ser He Gly Leu 
85 90 95 

Gly Leu Ala Ser Ala Val Gly Ala Ser Arg Ala Val Asp Asp Gly Asn 
100 105 110 

He Leu Val Leu Ala Ala Gly Asp Gly Gly Phe Leu Met Gly Leu Ser 
115 120 125 

Asp Leu Glu Ser Leu Val Gly Ala Ala Ser Ser Ala Val Val Val He 
130 135 140 

Tyr Asn Asp Ala Ala Tyr Gly Ala Glu He His Gin Tyr Gly Ser Arg 
145 150 155 160 

Gly Leu Thr Glu Lys Pro Met Leu He Pro Glu Val Asp Phe Ser Gly 
165 170 175 

He Ala Arg Ala He Gly Ala Glu Ser Ala He He Arg Lys Leu Ser 
180 185 190 

Asp Leu Ser Ala Leu Thr Asp Trp He Glu Ala Gly Ala Arg Gly Thr 
195 200 205 

Phe Val Ala Asp Cys Arg He Thr Ser Ser Val Arg Ala Pro Trp Leu 
210 215 220 

Ser Glu Trp Met Arg Ala Ser Gin Ala Ala Lys Glu Ala Val Ala Gly 
225 230 235 240 

<210> 17 
<211> 2838 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle: cassette 
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d' expression 



<220> 

<221> promoter 
<222> (1) . . (807) 










<220> 
<221> CDS 
<222> (847) 


. . (2538) 










<220> 

<221> terminator 
<222> (2539) . . (2838) 










<400> 17 
ggccccccct 


cgagcccaca 


gatggttaga gaggcttacg 


cagcaggtct 


catcaagacg 


60 


atctacccga 


gcaataatct 


ccaggaaatc aaataccttc 


ccaagaaggt 


taaagatgea 


120 


gtcaaaagat 


tcaggactaa 


ctgcatcaag aacacagaga 


aagatatatt 


tctcaagatc 


180 


agaagtacta 


ttccagtatg 


gacgattcaa ggcttgette 


acaaaccaag 


gcaagtaata 


240 


gagattggag 


tctctaaaaa 


ggtagttccc actgaatcaa 


aggccatgga 


gtcaaagatt 


300 


caaatagagg 


acctaacaga 


actcgccgta aagactggcg 


aacagttcat acagagtctc 


360 


ttacgactca 


atgacaagaa 


gaaaatcttc gtcaacatgg 


tggagcacga 


cacacttgtc 


420 


tactccaaaa 


atatcaaaga 


tacagtctca gaagaccaaa 


gggcaattga 


gacttttcaa 


480 


caaagggtaa 


tatccggaaa 


cctcctcgga ttccattgcc 


cagctatctg 


tcactttatt 


540 


gtgaagatag 


tggaaaagga 


aggtggctcc tacaaatgee 


ateattgega taaaggaaag 


600 


gccatcgttg 


aagatgcctc 


tgccgacagt ggtcccaaag 


atggaccccc 


acccacgagg 


660 


agcatcgtgg 


aaaaagaaga 


cgttccaacc aegtcttcaa 


agcaagtgga ttgatgtgat 


720 


atctccactg 


acgtaaggga 


tgacgcacaa tcccactatc 


ettegcaaga 


cccttcctct 


780 


atataaggaa 


gttcatttca 


tttggagaga acaeggggga 


ctctagagga 


tcagaggacg 


840 


aacaac atg 
Met 


tec cac ccc gec ate tec ctg caa gcg ctg cgc ggc age 
Ser His Pro Ala lie Ser Leu Gin Ala Leu Arg Gly Ser 


888 



1 5 10 

ggc gca gac ata cag tec ate cac ate ccc tac gag cgc cat gec gac 936 
Gly Ala Asp lie Gin Ser lie His lie Pro Tyr Glu Arg His Ala Asp 
15 20 25 " 30 

cag gac gec ggt gcg gac acg ccc gee egg cat ccc gtc gtc ate gtc 984 
Gin Asp Ala Gly Ala Asp Thr Pro Ala Arg His Pro Val Val He Val 
35 40 45 

ggc gee ggc ccc gtg ggc ctg teg ctg gee ate gac ctg gee cag cgc 1032 
Gly Ala Gly Pro Val Gly Leu Ser Leu Ala He Asp Leu Ala Gin Arg 
50 55 60 

ggc cag cgc gtg gtg ctg ctg gac aac gac tgc egg ctg tec acg ggc 1080 
Gly Gin Arg Val Val Leu Leu Asp Asn Asp Cys Arg Leu Ser Thr Gly 
65 70 75 

teg cgc gee ate tgc ttt tec aag cgc acg ctg gag ate tgg gac cgc 1128 
Ser Arg Ala He Cys Phe Ser Lys Arg Thr Leu Glu He Trp Asp Arg 
80 85 90 

ctg ggc gtg ggc cag ccc atg gtg gac aag ggc gtg tec tgg aac ctg 117 6 
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Leu Gly Val Gly Gin Pro Met Val Asp Lys Gly Val Ser Trp Asn Leu 
95 100 105 110 

ggc aag gtc ttc ttc aag gac cag ccg ctg tac cgc ttc gac ctg ctg 1224 
Gly Lys Val Phe Phe Lys Asp Gin Pro Leu Tyr Arg Phe Asp Leu Leu 
115 120 ' 125 

ccc gag gac ggc cac gag cgc ccg gcc ttc ate aac ctg cag cag tac 1272 
Pro Glu Asp Gly His Glu Arg Pro Ala Phe He Asn Leu Gin Gin Tyr 
130 135 140 

tac gcc gag gcc tat ctg gtc gag cgc gca ctg cag ctg ccg ctg ate 1320 
Tyr Ala Glu Ala Tyr Leu Val Glu Arg Ala Leu Gin Leu Pro Leu He 
145 150 155 

gac ctg cgc tgg cac age aag gtc acg gca ctg gag ccg cag gcc gag 1368 
Asp Leu Arg Trp His Ser Lys Val Thr Ala Leu Glu Pro Gin Ala Glu 
160 165 170 

ggc gcg ctg ctg acc gtg gag acg cct gac ggc age tac cgc ate gat 1416 
Gly Ala Leu Leu Thr Val Glu Thr Pro Asp Gly Ser Tyr Arg He Asp 
175 180 185 190 

gcg caa tgg gtc ctg gcc tgc gat ggc teg cgc teg ccg ctg cgc ggc 14 64 
Ala Gin Trp Val Leu Ala Cys Asp Gly Ser Arg Ser Pro Leu Arg Gly 
195 200 205 

ctg ctg ggc cag gaa age cat ggc cgc ate ttc cgc gac cgc ttc ctg 1512 
Leu Leu Gly Gin Glu Ser His Gly Arg He Phe Arg Asp Arg Phe Leu 
210 215 220 

ate gcc gac gtg aag atg cac gcc gaa ttc ccc acc gag cgc tgg ttc 1560 
He Ala Asp Val Lys Met His Ala Glu Phe Pro Thr Glu Arg Trp Phe 
225 230 235 

tgg ttc gac ccg ccc ttc cac ccg ggc cag age gtg ctg ctg cac cgc 1608 
Trp Phe Asp Pro Pro Phe His Pro Gly Gin Ser Val Leu Leu His Arg 
240 245 250 

cag ccc gac gat gtc tgg cgc ate gac ttc cag ctg ggc tgg gac gcg 1656 
Gin Pro Asp Asp Val Trp Arg He Asp Phe Gin Leu Gly Trp Asp Ala 
255 260 265 ~ ' 270 

gac ccc gag gaa gag aaa aag ccc gag aac ate gtg ccg cgc ate cgc 1704 
Asp Pro Glu Glu Glu Lys Lys Pro Glu Asn He Val Pro Arg He Arg 
275 280 285 

gcc ctg ctg ggc aag gac gcg ccc ttc gag ctg gaa tgg gcc age gtc 1752 
Ala Leu Leu Gly Lys Asp Ala Pro Phe Glu Leu Glu Trp Ala Ser Val 
290 295 300 

tac acc ttc gcc tgc ctg cgc atg gac cgc ttc gtc cat ggc cgc gtg 1800 
Tyr Thr Phe Ala Cys Leu Arg Met Asp Arg Phe Val His Gly Arg Val 
305 310 315 

gtc ttt gcg ggc gac age gcc cac ggc gtc teg ccg ttt ggc gca cgc 1848 
Val Phe Ala Gly Asp Ser Ala His Gly Val Ser Pro Phe Gly Ala Arg 
320 325 330 

ggc gcc aac age ggc gtg cag gat gcc gag aac ctg gca tgg aag ctg 18 96 
Gly Ala Asn Ser Gly Val Gin Asp Ala Glu Asn Leu Ala Trp Lys Leu 
335 340 345 350 

gac cgc gtg ctg cgc ggc cag gcc gat gcc teg ctg ate gcc acc tac 1944 
Asp Arg Val Leu Arg Gly Gin Ala Asp Ala Ser Leu He Ala Thr Tyr 
355 360 365 

ggc gcc gag cgc gaa tac gcg gcc gae gag aac ate cgc aac tec acg 1992 
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Gly Ala Glu Arg Glu Tyr Ala Ala Asp Glu Asn lie Arg Asn Ser Thr 
370 375 380 

cgc gcc acc gac ttc ate acg ccc aag age gag ate age cgc ctg ttt 2040 
Arg Ala Thr Asp Phe He Thr Pro Lys Ser Glu He Ser Arg Leu Phe 
385 390 395 

cgc gac gcc gtg ctg gac ctg gcg cgc gac cat gaa ttc gcg cgc cgc 2088 
Arg Asp Ala Val Leu Asp Leu Ala Arg Asp His Glu Phe Ala Arg Arg 
400 405 410 

ate gtc aac age ggg egg ctg tec gtg ccg gcc acg ctg cac ggc tec 2136 
He Val Asn Ser Gly Arg Leu Ser Val Pro Ala Thr Leu His Gly Ser 
415 420 425 430 

gcg etc aac acg cct gac acc gac acc ttc gac gga acg cag ctg ccc 2184 
Ala Leu Asn Thr Pro Asp Thr Asp Thr Phe Asp Gly Thr Gin Leu Pro 
435 440 " 445 

ggc gcc gtg ctg gcc gat gcg ccc atg cgc egg ccc ggc gca gac ggc 2232 
Gly Ala Val Leu Ala Asp Ala Pro Met Arg Arg Pro Gly Ala Asp Gly 
450 455 460 

acg gcc tgg ctg ctg cgc gca ctg gga ccg gac ttc acg ctg ctg cac 2280 
Thr Ala Trp Leu Leu Arg Ala Leu Gly Pro Asp Phe Thr Leu Leu His 
465 470 475 

ttc gac ccc acg ccc gcc tgg gcg cag gcg ctg ccc ggc gtg etc aac 2328 
Phe Asp Pro Thr Pro Ala Trp Ala Gin Ala Leu Pro Gly Val Leu Asn 
480 485 490 

ctg tec ate gcg gcc gag ggc gag gcc cat gcg cca gac gcc gac etc 237 6 
Leu Ser He Ala Ala Glu Gly Glu Ala His Ala Pro Asp Ala Asp Leu 
495 500 505 510 

ate gat gcg cgc ggc ctg gcg gcc aaa cgc ctg gat gca cgc ccc ggc 2424 
He Asp Ala Arg Gly Leu Ala Ala Lys Arg Leu Asp Ala Arg Pro Gly 
515 520 525 

acc age tac ctg ctg egg cct gac cag cat gtc tgc gcg cgc tgg cgc 2472 
Thr Ser Tyr Leu Leu Arg Pro Asp Gin His Val Cys Ala Arg Trp Arg 
530 535 540 

cgc ccc gac gaa gcc age gtg cgc gcc gcg ctg caa aga gcc tgc ggc 2520 
Arg Pro Asp Glu Ala Ser Val Arg Ala Ala Leu Gin Arg Ala Cys Gly 
545 550 555 

gcc gcc gcc acg gcc tga acctcttaag cttatcgata ccgtcgacga 2568 
Ala Ala Ala Thr Ala 
560 

atttccccga tegttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg 2628 

gtcttgegat gattatcata taatttctgt tgaattacgt taagcatgta ataattaaca 2688 

tgtaatgeat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca 2748 

tttaataege gatagaaaac aaaatatagc gegcaaacta ggataaatta tcgcgcgcgg 2808 

tgtcatctat gttcctaggt egggaattge 2838 

<210> 18 
<211> 284 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: cassette 
d' expression 
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<400> 18 
lie Val Pro ; 



i Arg Ala Leu Leu Gly 
10 



Leu Glu Trp 
Phe Val His 



Ala Ser 
20 



35 



Gly Arg 

Ser Pro Phe Gly Ala 
50 

Asn Leu Ala Trp Lys 
65 

Ser Leu lie Ala Thr 
85 

Asn lie Arg Asn Ser 
100 

Arg Leu 
Ala Arg 
His Gly 



Glu lie Ser 
115 



His Glu Phe 
130 



Ala Thr Leu 
145 



Asp Gly Thr 
Arg Pro Gly 



Gin Leu 
165 



Ala Asp 
180 



Val Tyr Thr Phe Ala 
25 



Val Val Phe Ala Gly 
40 



Arg Gly Ala Asn Ser 
55 



Leu Asp Arg Val Leu 
70 



Tyr Gly Ala Glu Arg 
90 



Thr Arg Ala Thr Asp 
105 



Phe Arg Asp Ala Val 
120 



Arg lie Val Asn Ser 
135 



Ser Ala Leu Asn Thr 
150 



Pro Gly Ala Val Leu 
170 



Gly Thr Ala Trp Leu 
185 



Lys Asp Ala Pro Phe Glu 
Cys Leu . 
Asp Ser i 



i Arg Met Asp Arg 
30 



Ala His Gly Val 
45 

Gin Asp Ala Glu 

Gin Ala Asp Ala 
80 

Ala Ala Asp Glu 
95 

Thr Pro Lys Ser 
110 

Leu Ala Arg Asp 
125 



Gly Arg Leu Ser Val Pro 
140 



Gly Val 
60 

Arg Gly 
75 

Glu Tyr 
Phe He 
Leu Asp 



Asp Phe Thr : 
195 



Leu Pro Gly ' 
210 



. His Phe Asp Pro Thr 
200 



Pro Asp 
155 

Ala Asp 
Leu Arg 
Pro Ala 



Thr. Asp Thr Phe 
160 



Ala Pro Met Arg 
175 



Ala Leu Gly Pro 
190 



Trp Ala Gin Ala 
205 



. Asn Leu Ser He Ala 
215 



Ala Glu Gly Glu Ala His 
220 



Ala Pro Asp Ala Asp 
225 



Leu Asp Ala 
Val Cys Ala 



Arg Pro 
245 



Arg Trp 
260 



Leu Gin Arg J 
275 



Leu He Asp Ala Arg 
230 



Gly Thr Ser Tyr Leu 
250 



Arg Arg Pro Asp Glu 
265 



Gly Ala Ala Ala Thr 
280 



Gly Leu 
235 

Leu Arg 
Ala Ser 
Ala 



Ala Ala Lys Arg 
240 



Pro Asp Gin His 
255 



Val Arg Ala Ala 
270 



<210> 19 
<211> 1839 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: cassette 
d' expression 

<220> 

<221> promoter 
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<222> (1) . . (547) 

<220> 
<221> CDS 

<222> (574) . . (1539) 
<220> 

<221> terminator 
<222> (1540) . . (1839) 

<400> 19 

ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat 60 

caagaatcca atgtttacgg gaaaaactat ggaagtatta tgtgagctca gcaagaagca 120 

gatcaatatg cggcacatat gcaacctatg ttcaaaaatg aagaatgtac agatacaaga 180 

tcctatactg ccagaatacg aagaagaata cgtagaaatt gaaaaagaag aaccaggcga 240 

agaaaagaat cttgaagacg taagcactga cgacaacaat gaaaagaaga agataaggtc 300 

ggtgattgtg aaagagacat agaggacaca tgtaaggtgg aaaatgtaag ggcggaaagt 360 

aaccttatca caaaggaatc ttatccccca ctacttatcc ttttatattt ttccgtgtca 420 

tttttgccct tgagttttcc tatataagga accaagttcg gcatttgtga aaacaagaaa 480 

aaatttggtg taagctattt tctttgaagt actgaggata caacttcaga gaaatttgta 54 0- 

agtttgtaga tctgaattcg atgcaggatg cac atg tec acc aag acc ttt gec 594 

Met Ser Thr Lys Thr Phe Ala 

1 5 

tec gec gec gac etc gaa ate aag cag gtc age ttc gac aag etc tec 642 
Ser Ala Ala Asp Leu Glu lie Lys Gin Val Ser Phe Asp Lys Leu Ser 
10 15 20 

gag cac gec tat gee tac acg gee gaa ggc gac ccc aac acc ggc ate 690 
Glu His Ala Tyr Ala Tyr Thr Ala Glu Gly Asp Pro Asn Thr Gly lie 
25 30 35 

ate att ggc gac gac gcg gtg atg gtg ate gac acc cag gee acg ccc 738 
He He Gly Asp Asp Ala Val Met Val He Asp Thr Gin Ala Thr Pro 
40 45 50 55 

gtc atg gee cag gac gtg ate cgc cgc ate cgt gag gtc acg gac aag 78 6 
Val Met Ala Gin Asp Val He Arg Arg He Arg Glu Val Thr Asp Lys 
60 65 70 

ccc ate aag tac gtg acg ctg teg cac tac cac gcg gtg cgc gtg ctg 834 
Pro He Lys Tyr Val Thr Leu Ser His Tyr His Ala Val Arg Val Leu 
75 80 85 

ggc gec teg gec ttc ttc gcg gaa ggc gec gaa cac ate att gec age 882 
Gly Ala Ser Ala Phe Phe Ala Glu Gly Ala Glu His He He Ala Ser 
90 95 100 

cag gac acc tac gac etc ate gtg gag cgc ggc gag cag gac aag gee 930 
Gin Asp Thr Tyr Asp Leu He Val Glu Arg Gly Glu Gin Asp Lys Ala 
105 110 115 

age gag ate ggc cgc ttt ccc cgc ctg ttc cag aac gtg gaa age gtg 978 
Ser Glu He Gly Arg Phe Pro Arg Leu Phe Gin Asn Val Glu Ser Val 
120 125 130 135 

ccc gat ggc atg acc tgg ccc acc etc acc ttc acc ggc aag atg acg 1026 
Pro Asp Gly Met Thr Trp Pro Thr Leu Thr Phe Thr Gly Lys Met Thr 
140 145 150 
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ctg tgg ctg ggc aag ctg gaa gtg cag ate ctg cag ctg ggc cgc ggc 1074 
Leu Trp Leu Gly Lys Leu Glu Val Gin lie Leu Gin Leu Gly Arg Gly 
155 160 165 

cac acc aag ggc gac acc gtg gtc tgg ctg ccc cag gac aag gtg ctg 1122 
His Thr Lys Gly Asp Thr Val Val Trp Leu Pro Gin Asp Lys Val Leu 
170 175 180 

ttc age ggc gac ctg gtg gag ttc ggc gec acg ccc tat gcg ggc gat 1170 
Phe Ser Gly Asp Leu Val Glu Phe Gly Ala Thr Pro Tyr Ala Gly Asp 
185 190 195 

gec tac ttc cag gac tgg ccg cac acg ctg gac gec ate gec gec ctg 1218 
Ala Tyr Phe Gin Asp Trp Pro His Thr Leu Asp Ala lie Ala Ala Leu 
200 205 210 215 

cag ccc gaa aag etc gtg ccc ggc egg ggc gee gcg ctg cag acg ccg 1266 
Gin Pro Glu Lys Leu Val Pro Gly Arg Gly Ala Ala Leu Gin Thr Pro 
220 225 230 

gee gag gtg cag gec ggc ctg gee ggc acg cgc gac ttc ate age gac 1314 
Ala Glu Val Gin Ala Gly Leu Ala Gly Thr Arg Asp Phe lie Ser Asp 
235 240 245 

ctg tgg acc gag gtc aag gee ggc gec gat gee cag cag gac ctg cgc 1362 
Leu Trp Thr Glu Val Lys Ala Gly Ala Asp Ala Gin Gin Asp Leu Arg 
250 255 260 

aag gtc tac gag gec gee ttc gee aag ctg cag ccc aag tac ggc cag 1410 
Lys Val Tyr Glu Ala Ala Phe Ala Lys Leu Gin Pro Lys Tyr Gly Gin 
265 270 275 

tgg gtg ate ttc aac cac tgc atg ccc ttc gat gtg acc cgc gec tat 1458 
Trp Val lie Phe Asn His Cys Met Pro Phe Asp Val Thr Arg Ala Tyr 
280 285 290 295 

gac gag gca teg ggc cac gee gac cca cgc ate tgg acc gee gag cgc 1506 
Asp Glu Ala Ser Gly His Ala Asp Pro Arg He Trp Thr Ala Glu Arg 
300 305 310 

gac cgc cag atg tgg ctg gcg etc gaa ggc tga tgcaagctta tegatacegt 1559 
Asp Arg Gin Met Trp Leu Ala Leu Glu Gly 
315 320 

cgacgaattt ccccgatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg 1619 

ttgeeggtet tgegatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa 1679 

ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat 1739 

tatacattta atacgegata gaaaacaaaa tatagegege aaactaggat aaattatege 17 99 

gcgcggtgtc atctatgtta etagateggg aattgeggee 1839 



<210> 20 
<211> 142 
<212> 

<213> Sequence artificielle 

<223> Description de la sequence artificielle: cassette 
d' expression 

<400> 20 

Lys Val Leu Phe Ser Gly Asp Leu Val Glu Phe Gly Ala Thr Pro Tyr 
15 10 15 



Ala Gly Asp Ala Tyr Phe Gin Asp Trp Pro His Thr Leu Asp Ala He 
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20 25 30 

Ala Ala Leu Gin Pro Glu Lys Leu Val Pro Gly Arg Gly Ala Ala Leu 
35 40 45 

Gin Thr Pro Ala Glu Val Gin Ala Gly Leu Ala Gly Thr Arg Asp Phe 
50 55 60 

He Ser Asp Leu Trp Thr Glu Val Lys Ala Gly Ala Asp Ala Gin Gin 
65 70 75 80 

Asp Leu Arg Lys Val Tyr Glu Ala Ala Phe Ala Lys Leu Gin Pro Lys 
85 90 95 

Tyr Gly Gin Trp Val He Phe Asn His Cys Met Pro Phe Asp Val Thr 
100 105 110 

Arg Ala Tyr Asp Glu Ala Ser Gly His Ala Asp Pro Arg He Trp Thr 
115 120 125 

Ala Glu Arg Asp Arg Gin Met Trp Leu Ala Leu Glu Gly 
130 135 140 

<210> 21 
<211> 4677 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: cassette 
d 1 expression 



<400> 21 
ccccctcgag 


gtcgacggta 


ttgatcagct 


tccagaaggt 


aattatccaa 


gatgtagcat 


60 


caagaatcca 


atgtttacgg 


gaaaaactat 


ggaagtatta 


tgtgagctca 


gcaagaagca 


120 


gatcaatatg 


cggcacatat 


gcaacctatg 


ttcaaaaatg 


aagaatgtac 


agatacaaga 


180 


tcctatactg 


ccagaatacg 


aagaagaata 


cgtagaaatt 


gaaaaagaag 


aaccaggcga 


240 


agaaaagaat 


cttgaagacg 


taagcactga 


cgacaacaat 


gaaaagaaga 


agataaggtc 


300 


ggtgattgtg 


aaagagacat 


agaggacaca 


tgtaaggtgg 


aaaatgtaag 


ggcggaaagt 


360 


aaccttatca 


caaaggaatc 


ttatccccca 


ctacttatcc 


ttttatattt 


ttccgtgtca 


420 


tttttgccct 


tgagttttcc 


tatataagga 


accaagttcg 


gcatttgtga 


aaacaagaaa 


480 


aaatttggtg 


taagctattt 


tctttgaagt 


actgaggata 


caacttcaga 


gaaatttgta 


540 


agtttgtaga 


tctgaattcg 


atgcaggatg 


cacatgtcca 


ccaagacctt 


tgcctccgcc 


600 


gccgacctcg 


aaatcaagca 


ggtcagcttc 


gacaagctct 


ccgagcacgc 


ctatgcctac 


660 


acggccgaag 


gcgaccccaa 


caccggcatc 


atcattggcg 


acgacgcggt 


gatggtgatc 


720 


gacacccagg 


ccacgcccgt 


catggcccag 


gacgtgatcc 


gccgcatccg 


tgaggtcacg 


780 


gacaagccca 


tcaagtacgt 


gacgctgtcg 


cactaccacg 


cggtgcgcgt 


gctgggcgcc 


840 


tcggccttct 


tcgcggaagg 


cgccgaacac 


atcattgcca 


gccaggacac 


ctacgacctc 


900 


atcgtggagc 


gcggcgagca 


ggacaaggcc 


agcgagatcg 


gccgctttcc 


ccgcctgttc 


960 


cagaacgtgg 


aaagcgtgcc 


cgatggcatg 


acctggccca 


ccctcacctt 


caccggcaag 


1020 
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atgacgctgt 


ggctgggcaa 


gctggaagtg 


cagatcctgc 


agctgggccg 


cggccacacc 


1080 


aagggcgaca 


ccgtggtctg 


gctgccccag 


gacaaggtgc 


tgttcagcgg 


cgacctggtg 


1140 


gagttcggcg 


ccacgcccta 


tgcgggcgat 


gcctacttcc 


aggactggcc 


gcacacgctg 


1200 


gacgccatcg 


ccgccctgca 


gcccgaaaag 


ctcgtgcccg 


gccggggcgc 


cgcgctgcag 


1260 


acgccggccg 


aggtgcaggc 


cggcctggcc 


ggcacgcgcg 


acttcatcag 


cgacctgtgg 


1320 


accgaggtca 


aggccggcgc 


cgatgcccag 


caggacctgc 


gcaaggtcta 


cgaggccgcc 


1380 


ttcgccaagc 


tgcagcccaa 


gtacggccag 


tgggtgatct 


tcaaccactg 


catgcccttc 


1440 


gatgtgaccc 


gcgcctatga 


cgaggcatcg 


ggccacgccg 


acccacgcat 


ctggaccgcc 


1500 


gagcgcgacc 


gccagatgtg 


gctggcgctc 


gaaggctgat 


gcaagcttat 


cgataccgtc 


1560 


gacgaatttc 


cccgatcgtt 


caaacatttg 


gcaataaagt 


ttcttaagat 


tgaatcctgt 


1620 


tgccggtctt 


gcgatgatta 


tcatataatt 


tctgttgaat 


tacgttaagc 


atgtaataat 


1680 


taacatgtaa 


tgcatgacgt 


tatttatgag 


atgggttttt 


atgattagag 


tcccgcaatt 


1740 


atacatttaa 


tacgcgatag 


aaaacaaaat 


atagcgcgca 


aactaggata 


aattatcgcg 


1800 


cgcggtgtca 


tctatgttac 


tagatcggga 


attgcggccc 


cccctcgagc 


ccacagatgg 


1860 


ttagagaggc 


ttacgcagca 


ggtctcatca 


agacgatcta 


cccgagcaat 


aatctccagg 


1920 


aaatcaaata 


ccttcccaag 


aaggttaaag 


atgcagtcaa 


aagattcagg 


actaactgca 


1980 


tcaagaacac 


agagaaagat 


atatttctca 


agatcagaag 


tactattcca 


gtatggacga 


2040 


ttcaaggctt 


gcttcacaaa 


ccaaggcaag 


taatagagat 


tggagtctct 


aaaaaggtag 


2100 


ttcccactga 


atcaaaggcc 


atggagtcaa 


agattcaaat 


agaggaccta 


acagaactcg 


2160 


ccgtaaagac 


tggcgaacag 


ttcatacaga 


gtctcttacg 


actcaatgac 


aagaagaaaa 


2220 


tcttcgtcaa 


catggtggag 


cacgacacac 


ttgtctactc 


caaaaatatc 


aaagatacag 


2280 


tctcagaaga 


ccaaagggca 


attgagactt 


ttcaacaaag 


ggtaatatcc 


ggaaacctcc 


2340 


tcggattcca 


ttgcccagct 


atctgtcact 


ttattgtgaa 


gatagtggaa 


aaggaaggtg 


2400 


gctcctacaa 


atgccatcat 


tgcgataaag 


gaaaggccat 


cgttgaagat 


gcctctgccg 


2460 


acagtggtcc 


caaagatgga 


cccccaccca 


cgaggagcat 


cgtggaaaaa 


gaagacgttc 


2520 


caaccacgtc 


ttcaaagcaa 


gtggattgat 


gtgatatctc 


cactgacgta 


agggatgacg 


2580 


cacaatccca 


ctatccttcg 


caagaccctt 


cctctatata 


aggaagttca 


tttcatttgg 


2640 


agagaacacg 


ggggactcta 


gaggatcaga 


ggacgaacaa 


catgtcccac 


cccgccatct 


2700 


ccctgcaagc 


gctgcgcggc 


agcggcgcag 


acatacagtc 


catccacatc 


ccctacgagc 


2760 


gccatgccga 


ccaggacgcc 


ggtgcggaca 


cgcccgcccg 


gcatcccgtc 


gtcatcgtcg 


2820 


gcgccggccc 


cgtgggcctg 


tcgctggcca 


tcgacctggc 


ccagcgcggc 


cagcgcgtgg 


2880 


tgctgctgga 


caacgactgc 


cggctgtcca 


cgggctcgcg 


cgccatctgc 


ttttccaagc 


2940 


gcacgctgga 


gatctgggac 


cgcctgggcg 


tgggccagcc 


catggtggac 


aagggcgtgt 


3000 


cctggaacct 


gggcaaggtc 


ttcttcaagg 


accagccgct 


gtaccgcttc 


gacctgctgc 


3060 
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ccgaggacgg 


ccacgagcgc 


ccggccttca 


tcaacctgca 


gcagtactac 


gccgaggcct 


3120 


atctggtcga 


gcgcgcactg 


cagctgccgc 


tgatcgacct 


gcgctggcac 


agcaaggtca 


3180 


cggcactgga 


gccgcaggcc 


gagggcgcgc 


tgctgaccgt 


ggagacgcct 


gacggcagct 


3240 


accgcatcga 


tgcgcaatgg 


gtcctggcct 


gcgatggctc 


gcgctcgccg 


ctgcgcggcc 


3300 


tgctgggcca 


ggaaagccat 


ggccgcatct 


tccgcgaccg 


cttcctgatc 


gccgacgtga 


3360 


agatgcacgc 


cgaattcccc 


accgagcgct 


ggttctggtt 


cgacccgccc 


ttccacccgg 


3420 


gccagagcgt 


gctgctgcac 


cgccagcccg 


acgatgtctg 


gcgcatcgac 


ttccagctgg 


3480 


gctgggacgc 


ggaccccgag 


gaagagaaaa 


agcccgagaa 


catcgtgccg 


cgcatccgcg 


3540 


ccctgctggg 


caaggacgcg 


cccttcgagc 


tggaatgggc 


cagcgtctac 


accttcgcct 


3600 


gcctgcgcat 


ggaccgcttc 


gtccatggcc 


gcgtggtctt 


tgcgggcgac 


agcgcccacg 


3660 


gcgtctcgcc 


gtttggcgca 


cgcggcgcca 


acagcggcgt 


gcaggatgcc 


gagaacctgg 


3720 


catggaagct 


ggaccgcgtg 


ctgcgcggcc 


aggccgatgc 


ctcgctgatc 


gccacctacg 


3780 


gcgccgagcg 


cgaatacgcg 


gccgacgaga 


acatccgcaa 


ctccacgcgc 


gccaccgact 


3840 


tcatcacgcc 


caagagcgag 


atcagccgcc 


tgtttcgcga 


cgccgtgctg 


gacctggcgc 


3900 


gcgaccatga 


attcgcgcgc 


cgcatcgtca 


acagcgggcg 


gctgtccgtg 


ccggccacgc 


3960 


tgcacggctc 


cgcgctcaac 


acgcctgaca 


ccgacacctt 


cgacggaacg 


cagctgcccg 


4020 


gcgccgtgct 


ggccgatgcg 


cccatgcgcc 


ggcccggcgc 


agacggcacg 


gcctggctgc 


4080 


tgcgcgcact 


gggaccggac 


ttcacgctgc 


tgcacttcga 


ccccacgccc 


gcctgggcgc 


4140 


aggcgctgcc 


cggcgtgctc 


aacctgtcca 


tcgcggccga 


gggcgaggcc 


catgcgccag 


4200 


acgccgacct 


catcgatgcg 


cgcggcctgg 


cggccaaacg 


cctggatgca 


cgccccggca 


4260 


ccagctacct 


gctgcggcct 


gaccagcatg 


tctgcgcgcg 


ctggcgccgc 


cccgacgaag 


4320 


ccagcgtgcg 


cgccgcgctg 


caaagagcct 


gcggcgccgc 


cgccacggcc 


tgaacctctt 


4380 


aagcttatcg 


ataccgtcga 


cgaatttccc 


cgatcgttca 


aacatttggc 


aataaagttt 


4440 


cttaagattg 


aatcctgttg 


ccggtcttgc 


gatgattatc 


atataatttc 


tgttgaatta 


4500 


cgttaagcat 


gtaataatta 


acatgtaatg 


catgacgtta 


tttatgagat 


gggtttttat 


4560 


gattagagtc 


ccgcaattat 


acatttaata 


cgcgatagaa 


aacaaaatat 


agcgcgcaaa 


4620 


ctaggataaa 


ttatcgcgcg 


cggtgtcatc 


tatgttccta 


ggtcgggaat 


tgcggcc 


4677 



<210> 22 
<211> 8187 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: cassette 
d' expression 

<400> 22 

ccccctcgag gtcgacggta ttgatcagct tccagaaggt aattatccaa gatgtagcat 60 
caagaatcca atgtttacgg gaaaaactat ggaagtatta tgtgagctca gcaagaagca 120 
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gatcaatatg 


cggcacatat 


gcaacctatg 


ttcaaaaatg 


aagaatgtac 


agatacaaga 




tccfcatactg 


ccagaatacg 


aagaagaata 


cgtagaaatt 


gaaaaagaag 


aaccaggcga 




agaaaagaat 


cttgaagacg 


taagcactga 


cgacaacaat 


gaaaagaaga 


agataaggtc 




ggtgattgtg 


aaagagacat 


agaggacaca 


tgtaaggtgg 


aaaatgtaag 


ggcggaaagt 




aaccttatca 


caaaggaatc 


ttatccccca 


ctacttatcc 


ttttatattt 


ttccgtgtca 




fcfcfctfcgcccfc 


tgagttttcc 


tatataagga 


accaagttcg 


gcatttgtga 


aaacaagaaa 




aaatttggtg 


taagctattt 


tctttgaagt 


actgaggata 


caacttcaga 


gaaatttgta 




agtttgtaga 


tctgaattcg 


atgcaggatg 


cacatgtcca 


ccaagacctt 


tgcctccgcc 




gccgacctcg 


aaatcaagca 


ggtcagcttc 


gacaagctct 


ccgagcacgc 


ctatgcctac 




acggccgaag 


gcgaccccaa 


caccggcatc 


atcattggcg 


acgacgcggt 


gatggtgatc 




gacacccagg 


ccacgcccgt 


catggcccag 


gacgtgatcc 


gccgcatccg 


tgaggtcacg 




gacaagccca 


tcaagtacgt 


gacgctgtcg 


cactaccacg 


cggtgcgcgt 


gctgggcgcc 


840 


tcggccttct 


tcgcggaagg 


cgccgaacac 


atcattgcca 


gccaggacac 


ctacgacctc 




atcgtggagc 


gcggcgagca 


ggacaaggcc 


agcgagatcg 


gccgctttcc 


ccgcctgttc 




cagaacgtgg 


aaagcgtgcc 


cgatggcatg 


acctggccca 


ccctcacctt 


caccggcaag 




atgacgctgt 


ggctgggcaa 


gctggaagtg 


cagatcctgc 


agctgggccg 


cggccacacc 




aagggcgaca 


ccgtggtctg 


gctgccccag 


gacaaggtgc 


tgttcagcgg 


cgacctggtg 




gagttcggcg 


ccacgcccta 


tgcgggcgat 


gcctacttcc 


aggactggcc 


gcacacgctg 




gacgccatcg 


ccgccctgca 


gcccgaaaag 


ctcgtgcccg 


gccggggcgc 


cgcgctgcag 




acgccggccg 


aggtgcaggc 


cggcctggcc 


ggcacgcgcg 


acttcatcag 


cgacctgtgg 




accgaggtca 


aggccggcgc 


cgatgcccag 


caggacctgc 


gcaaggtcta 


cgaggccgcc 


1380 


ttcgccaagc 


tgcagcccaa 


gtacggccag 


tgggtgatct 


tcaaccactg 


catgcccttc 


1440 


gatgtgaccc 


gcgcctatga 


cgaggcatcg 


ggccacgccg 


acccacgcat 


ctggaccgcc 


1500 


gagcgcgacc 


gccagatgtg 


gctggcgctc 


gaaggctgat 


gcaagcttat 


cgataccgtc 


1560 


gacgaatttc 


cccgatcgtt 


caaacatttg 


gcaataaagt 


ttcttaagat 


tgaatcctgt 


1620 


tgccggtctt 


gcgatgatta 


tcatataatt 


tctgttgaat 


tacgttaagc 


atgtaataat 


1680 




tgcatgacgt 


tatttatgag 


atgggttttt 


atgattagag 


tcccgcaatt 


1740 


atacatttaa 


tacgcgatag 


aaaacaaaat 


atagcgcgca 


aactaggata 


aattatcgcg 


1800 


cgcggtgtca 


tctatgttac 


tagatcggga 


attgcggccc 


cccctcgagc 


ccacagatgg 


1860 


ttagagaggc 


ttacgcagca 


ggtctcatca 


agacgatcta 


cccgagcaat 


aatctccagg 


1920 




ccttcccaag 


aaggttaaag 


atgcagtcaa 


aagattcagg 


actaactgca 


1980 


tcaagaacac 


agagaaagat 


atatttctca 


agatcagaag 


tactattcca 


gtatggacga 


2040 


ttcaaggctt 


gcttcacaaa 


ccaaggcaag 


taatagagat 


tggagtctct 


aaaaaggtag 


2100 


ttcccactga 


atcaaaggcc 


atggagtcaa 


agattcaaat 


agaggaccta 


acagaactcg 


2160 
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tggcgaacag 


ttcatacaga 


gtctcttacg 


actcaatgac 








catggtggag 


cacgacacac 


tt gt ct act c 


caaaaatat c 


aaagat acag 






ccaaagggca 




ttcaacaaag 


ggt aat at cc 


ggaaacctcc 






t t gcccagct 


at ctgt cact 


t tattgt gaa 


gatagtggaa 


aaggaaggtg 








t gcgat aaag 


gaaaggecat 


cgttgaagat 


gcctctgccg 










cgaggagcat 


cgt ggaaaaa 


gaagacgttc 








gtggattgat 


gtgatat ct c 


cact ga cgt a 


agggatgacg 










cct ctatat a 


aggaagt t ca 


LmcaT: rtgg 








gaggatcaga 


ggacgaacaa 


catgt cccac 


cccgccatct 






gctgcgcggc 


ageggegcag 


acatacagtc 


catccacatc 


ccctacgagc 




gclatgccgl 


ccaggacgcc 


ggtgcggaca 


cgcccgcccg 


gcatcccgtc 


gtcategteg 






cgt gggect g 


t cget ggeca 


tcgacctggc 


ccagcgcggc 


cagcgcgtgg 




tgctgctgga 


caacgactgc 


egget gtcca 


cgggctcgcg 


cgecat ct gc 


ttttccaagc 




gcacgct gga 


gat ctgggac 


cgect gggcg 


tgggccagcc 


catggtggac 


aagggcgtgt 








ttcttcaagg 


accagccgct 


gt a c eg ctt c 


gacctgctgc 




ccgaggacgg 


ccacgagcgc 


ccggcctt ca 


t caacct gca 


gcagt act ac 


gccgaggcct 




at ct ggt cga 


gcgcgcactg 


cagct geege 


tgat cgacct 


gcgctggcac 


agcaaggtca 






gccgcaggcc 


gagggegege 


t get gaeegt 


ggaga cgect 


gaeggcaget 








gtcctggcct 


gcgat gg etc 


gcgctcgccg 


ctgcgcggcc 






ggllaglclt 




tccgcgaccg 


ctt cct gat c 


gccgacgtga 








accgagcgct 


ggtt ct ggtt 


cgacccgccc 


ttccacccgg 








cgccagcccg 


acgatgt ctg 


gegcat cgac 


ttccagctgg 






ggaccccgag 


gaagagaaaa 


ageccgagaa 


catcgtgccg 


cgcatccgcg 






caaggacgeg 


cccttcgagc 


tggaatgggc 


cagcgtctac 


accttcgcct 


3600 








gcgtggt ctt 


tgegggegae 


agcgcccacg 










acageggegt 


geaggatgee 


gagaacctgg 










aggecgat gc 


ct egctgate 


gccacctacg 


3780 






gecgacgaga 


acatccgcaa 


ct ccacgcgc 


gccaccgact 


3840 






atcagccgcc 


t gttt cgega 


cgccgtgctg 


gacctggcgc 


3900 


gcgaccatga 




cgcatcgtca 


acagegggeg 


gctgt ccgtg 


ccggccacgc 


3960 






acgcctgaca 


ccgacacctt 


egaeggaacg 


cagctgcccg 


4020 


gcgccgt get 


ggccgatgcg 


cccatgcgcc 


ggcccggcgc 


agaeggcacg 


gcctggctgc 


4080 


tgcgcgcact 


gggaceggae 


ttcacgctgc 


tgeacttega 


ccccacgccc 


gcctgggcgc 


4140 


aggcgctgcc 


cggcgtgctc 


aacctgtcca 


tcgcggccga 


gggegaggee 


catgcgccag 


4200 
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acgccgacct 


catcgatgcg 


cgcggcctgg 


cggccaaacg 


cctggatgca 


cgccccggca 




ccagctacct 


gctgcggcct 


gaccagcatg 


tctgcgcgcg 


ctggcgccgc 


cccgacgaag 




ccagcgtgcg 


cgccgcgctg 


caaagagcct 


gcggcgccgc 


cgccacggcc 


tgaacctctt 




aagcttatcg 


ataccgtcga 


cgaatttccc 


cgatcgttca 


aacatttggc 


aataaagttt 




cttaagattg 


aatcctgttg 


ccggtcttgc 


gatgattatc 


atataatttc 


tgttgaatta 


4500 


cgttaagcat 


gtaataatta 


acatgtaatg 


catgacgtta 


tttatgagat 


gggtttttat 




gattagagtc 


ccgcaattat 


acatttaata 


cgcgatagaa 


aacaaaatat 


agcgcgcaaa 




ctaggataaa 


ttatcgcgcg 


cggtgtcatc 


tatgttccta 


ggtcgaggag 


aaatatgagt 




cgaggcatgg 


atacactaag 


ttcccctgaa 


gtgagcatga 


tctttgatgc 


tgagatgatt 




cccagagcaa 


gatagtttgt 


gctgcaagtg 


acacaattgt 


aatgaaacca 


ccactcaacg 


4800 


aatttacttg 


tggctttgac 


atgtcgtgtg 


ctctgtttgt 


atttgtgagt 


gccggttggt 




aattattttt 


gttaatgtga 


ttttaaaacc 


tcttatgtaa 


atagttactt 


tatctattga 


4920 


agtgtgttct 


tgtggtctat 


agtttctcaa 


agggaaatta 


aaatgttgac 


atcccattta 


4980 


caattgataa 


cttggtatac 


acaaactttg 


taaatttggt 


gatatttatg 


gtcgaaagaa 


5040 


ggcaataccc 


attgtatgtt 


ccaatatcaa 


tatcaatacg 


ataacttgat 


aatactaaca 


5100 


tatgattgtc 


attgtttttc 


cagtatcaat 


atacattaag 


ctactacaaa 


attagtataa 




atcactatat 


tataaatctt 


tttcggttgt 


aacttgtaat 


tcgtgggttt 


ttaaaataaa 




agcatgtgaa 


aattttcaaa 


taatgtgatg 


gcgcaatttt 


attttccgag 


ttccaaaata 




ttgccgcttc 


attaccctaa 


tttgtggcgc 


cacatgtaaa 


acaaaagacg 


attcttagtg 




gctatcactg 


ccatcacgcg 


gatcactaat 


atgaaccgtc 


gattaaaaca 


gatcgacggt 


5400 


ttatacatca 


ttttattgta 


cacacggatc 


gatatctcag 


ccgttagatt 


taatatgcga 


5460 


tctgattgct 


caaaaaatag 


actctccgtc 


tttgcctata 


aaaacaattt 


cacatctttc 


5520 


tcacccaaat 


ctactcttaa 


ccgttcttct 


tcttctacag 


acatcaattt 


ctctcgactc 


5580 


tagaggatcc 


aagcttatcg 


atttcgaacc 


cctcatgact 


tcacttacag 


tgtccggccg 


5640 


ggtggcgcag 


gtcctcagca 


gctatgtcag 


cgatgtgttc 


ggtgtgatgg 


gcaacggaaa 


5700 


cgtctacttc 


ctggacgccg 


ccgagaagga 


gggcctccgc 


ttcacggccg 


tacgccatga 


5760 


aggtgccgcc 


atcgcggcgg 


cggacgccta 


ctatcgggca 


tccgggcgcc 


tggcggcggg 


5820 


gaccaccacc 


tacggccccg 


gttacaccaa 


cgccctgacg 


gccctcgccg 


aggcggtcca 


5880 


ggcgcagatc 


cccgtggtgc 


tcgtcaccgg 


ggacgccccg 


agcagcggcg 


cccggccttg 


5940 


ggacgtggac 


caggccgcga 


tcgccgccgg 


gctgggggcg 


gcgaccttca 


cggtcacccg 


6000 


tgaagccgca 


ggctccatca 


cgcaggaagc 


ggtggagtac 


gcacttgccc 


ggcggaccgc 


6060 


cgtcgtgatc 


gccgttccat 


acgacctgtc 


ggcccttgag 


gcggcggagg 


aagatcttcc 


6120 


cgtgccgccg 


gcggcctcgg 


ttccggacgc 


catcggcggc 


ggactcggac 


gggcggccga 


6180 


agtgcgggcg 


gccgaattgc 


tggcgggcgc 


gaagcggccg 


ctcatccttg 


ccggccgcgg 


6240 
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tgcgcacctc 


gcaggaaccg 


gccccgaact 


ccgggaactc 


gccgaccgcc 


tcggcgcgct 


6300 


cacggccggc 


accgcactgg 


cgctgaacct 


gctgcagggc 


gaggggtacc 


tcggcgtcgc 


6360 


gggcggcttc 


ggcacggata 


ccgccgccgg 


gctcatgggc 


gaggcggacg 


tggtgctcgt 


6420 


ggcgggagcc 


agcctgaccc 


ccttcaccat 


gcgcttcggc 


cacctgatcg 


gcccggacgc 


6480 


caccgtgatc 


cagatcgaca 


ccgccatgga 


gccgacggac 


ccgcgggtgg 


acctgtttgt 


6540 


cagtgcggac 


gcgaaggccg 


ctgccggccg 


gatcctccgg 


ctgctggatg 


acgccgccgg 


6600 


ggccaatgcg 


tcgaaggcct 


ggcgcgcgga 


agcactcaag 


cgtctggccg 


aaggaccctg 


6660 


ccaccacccc 


ggcaccgcag 


agaccacgga 


cggccgcctt 


gacccccggg 


cgcttgcttc 


6720 


ggcactggat 


gccgtcctgc 


cggaacgccg 


caccgtggtc 


caggacggcg 


ggcacttcct 


6780 


gggctgggca 


cccatgtact 


ggcgcatccc 


ccgtcctcag 


gacctggtca 


tggtggggac 


6840 


cgcgtaccag 


tcgatcgggc 


ttggcctggc 


cagcgccgtg 


ggggcgtccc 


gggccgtgga 


6900 


cgacggcaat 


atcctggtgc 


tggcggcggg 


cgacggcgga 


ttcctgatgg 


gcctgtccga 


6960 


cctggaatcg 


ctcgtgggcg 


cggcgagcag 


cgccgtcgtg 


gtgatctaca 


acgacgccgc 


7020 


ctacggggcc 


gagatccatc 


agtacggctc 


acgggggctc 


accgaaaagc 


ccatgctgat 


7080 


ccccgaagtg 


gacttcagcg 


ggattgcccg 


cgcgatcggg 


gcggaatccg 


caatcatccg 


7140 


caagctgtcg 


gacctctccg 


cgctcacgga 


ctggatcgag 


gccggcgcca 


ggggaacctt 


7200 


cgtggccgac 


tgccgcatca 


cctcaagcgt 


ccgggccccg 


tggctgagcg 


aatggatgag 


7260 


ggcctcgcaa 


gcggcgaagg 


aggcggtggc 


gggctagggc 


cggcctcgtc 


gaaatgccgc 


7320 


cctccaaccc 


aactcagtac 


cagctcaggg 


cgttctcagg 


gctgggaacg 


ccctgagctg 


7380 


ctactcattt 


gttcgaactc 


gaggtcgacg 


gtatcgataa 


gcttgatatc 


gaattcctgc 


7440 


agcccggggg 


atccactagg 


ggatcccccg 


atccgcgttt 


gtgttttctg 


ggtttctcac 


7500 


ttaagcgtct 


gcgttttact 


tttgtattgg 


gtttggcgtt 


tagtagtttg 


cggtagcgtt 


7560 


cttgttatgt 


gtaattacgc 


tttttcttct 


tgcttcagca 


gtttcggttg 


aaatataaat 


7620 


cgaatcaagt 


ttcactttat 


cagcgttgtt 


ttaaattttg 


gcattaaatt 


ggtgaaaatt 


7680 


gcttcaattt 


tgtatctaaa 


tagaagagac 


aacatgaaat 


tcgacttttg 


acctcaaatc 


7740 


ttcgaacatt 


tatttcctga 


tttcacgatg 


gatgaggata 


acgaaagggc 


ggttcctatg 


7800 


tccgggaaag 


ttcccgtaga 


agacaatgag 


caaagctact 


gaaacgcgga 


cacgacgtcg 


7860 


cattggtacg 


gatatgagtt 


aaaccgactc 


aattccttta 


ttaagacata 


aaccgatttt 


7920 


ggttaaagtg 


taacagtgag 


ctgatataaa 


accgaaacaa 


accggtacaa 


gtttgattga 


7980 


gcaacttgat 


gacaaacttc 


agaattttgg 


ttattgaatg 


aaaatcatag 


tctaatcgta 


8040 


aaaaatgtac 


agaagaaaag 


ctagagcaga 


acaaagattc 


tatattctgg 


ttccaattta 


8100 


tcatcgcttt 


aacgtccctc 


agatttgatc 


gggctgcagg 


aattcggcct 


gactgatcat 


8160 


ttaaacacta 


ggtcgggaat 


tgcggcc 
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